Prometheus-Eval
他の言語モデルを評価するためのオープンソースツールキット
一般製品プログラミングオープンソース言語モデル
Prometheus-Evalは、大規模言語モデル(LLM)の生成タスクにおける性能を評価するためのオープンソースツールキットです。簡潔なインターフェースを提供し、Prometheusモデルを使用して指示と応答ペアを評価します。Prometheus 2モデルは直接評価(絶対評価)とペアワイズランキング(相対評価)をサポートしており、人間の判断や独自の言語モデルベースの評価を模倣することで、公平性、制御性、経済性の問題を解決します。
Prometheus-Eval 最新のトラフィック状況
月間総訪問数
474564576
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:34