hallucination-leaderboard

一个用于比较大型语言模型在总结短文档时产生幻觉的排行榜。

普通产品其他LLM幻觉检测
该产品是一个由Vectara开发的开源项目,用于评估大型语言模型(LLM)在总结短文档时的幻觉产生率。它使用了Vectara的Hughes幻觉评估模型(HHEM-2.1),通过检测模型输出中的幻觉来计算排名。该工具对于研究和开发更可靠的LLM具有重要意义,能够帮助开发者了解和改进模型的准确性。
打开网站

hallucination-leaderboard 最新流量情况

月总访问量

502571820

跳出率

37.10%

平均页面访问数

5.9

平均访问时长

00:06:29

hallucination-leaderboard 访问量趋势

hallucination-leaderboard 访问地理位置分布

hallucination-leaderboard 流量来源

hallucination-leaderboard 替代品