幻覚リーダーボード
大型言語モデルが短い文書を要約する際に生じる幻覚を比較するためのランキングです。
一般製品その他LLM幻覚検出
Vectara社が開発したオープンソースプロジェクトで、大型言語モデル(LLM)が短い文書を要約する際の幻覚発生率を評価します。Vectara社のHughes幻覚評価モデル(HHEM-2.1)を用いて、モデルの出力における幻覚を検出することでランキングを算出します。より信頼性の高いLLMの研究開発に重要なツールであり、開発者はモデルの精度を理解し改善することができます。
幻覚リーダーボード 最新のトラフィック状況
月間総訪問数
474564576
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:34