Prometheus-Eval

他の言語モデルを評価するためのオープンソースツールキット

一般製品プログラミングオープンソース言語モデル
Prometheus-Evalは、大規模言語モデル(LLM)の生成タスクにおける性能を評価するためのオープンソースツールキットです。簡潔なインターフェースを提供し、Prometheusモデルを使用して指示と応答ペアを評価します。Prometheus 2モデルは直接評価(絶対評価)とペアワイズランキング(相対評価)をサポートしており、人間の判断や独自の言語モデルベースの評価を模倣することで、公平性、制御性、経済性の問題を解決します。
ウェブサイトを開く

Prometheus-Eval 最新のトラフィック状況

月間総訪問数

474564576

直帰率

36.20%

平均ページ/訪問

6.1

平均訪問時間

00:06:34

Prometheus-Eval 訪問数の傾向

Prometheus-Eval 訪問地理的分布

Prometheus-Eval トラフィックソース

Prometheus-Eval 代替品