Skip to content
New issue

Have a question about this project? # for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “#”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? # to your account

人手評価用のフレームワークの追加 #47

Open
1 task
speed1313 opened this issue Oct 8, 2024 · 3 comments
Open
1 task

人手評価用のフレームワークの追加 #47

speed1313 opened this issue Oct 8, 2024 · 3 comments

Comments

@speed1313
Copy link
Collaborator

  • 各モデルのpredictionをもとにして, モデルA vs. モデルB の人手評価を簡単に行えるようにしたい.
@Silviase
Copy link
Collaborator

ResultsMetricの計算DBへの格納と同様に何か行いたいですね.
定期的に#playgroundにポストして人手評価ができるような仕組みがあると良いのですが.

@Silviase
Copy link
Collaborator

デカい人手評価はとても偉くて,こういう評価用のモデルを作ってからそれを報酬に推論モデルを強化するなどができるので作っておくと貢献になりそう

https://llava-vl.github.io/blog/2024-10-03-llava-critic/

@Silviase
Copy link
Collaborator

「目的」「出力(1つあるいは組み)」「スコア(あるいは優劣)」を大量に集める必要があるが,Out-of-domainをどのように解決したかは気になる(こういう場合,「目的」は単なるタスク分類器としてしか機能しない場合があるが…)

# for free to join this conversation on GitHub. Already have an account? # to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants