hallucination-leaderboard
一个用于比较大型语言模型在总结短文档时产生幻觉的排行榜。
普通产品其他LLM幻觉检测
该产品是一个由Vectara开发的开源项目,用于评估大型语言模型(LLM)在总结短文档时的幻觉产生率。它使用了Vectara的Hughes幻觉评估模型(HHEM-2.1),通过检测模型输出中的幻觉来计算排名。该工具对于研究和开发更可靠的LLM具有重要意义,能够帮助开发者了解和改进模型的准确性。
hallucination-leaderboard 最新流量情况
月总访问量
502571820
跳出率
37.10%
平均页面访问数
5.9
平均访问时长
00:06:29