Prometheus-Eval

用于评估其他语言模型的开源工具集

普通产品编程开源语言模型
Prometheus-Eval 是一个用于评估大型语言模型(LLM)在生成任务中表现的开源工具集。它提供了一个简单的接口,使用 Prometheus 模型来评估指令和响应对。Prometheus 2 模型支持直接评估(绝对评分)和成对排名(相对评分),能够模拟人类判断和专有的基于语言模型的评估,解决了公平性、可控性和可负担性的问题。
打开网站

Prometheus-Eval 最新流量情况

月总访问量

494758773

跳出率

37.69%

平均页面访问数

5.7

平均访问时长

00:06:29

Prometheus-Eval 访问量趋势

Prometheus-Eval 访问地理位置分布

Prometheus-Eval 流量来源

Prometheus-Eval 替代品