人類最後の試験 (Humanity's Last Exam)
人類最後の試験 (Humanity's Last Exam) は、大規模言語モデルの能力を測るための多様なモダリティを含むベンチマークテストです。
一般製品その他人工知能ベンチマークテスト
人類最後の試験 (Humanity's Last Exam) は、世界中の専門家による協働で開発された多様なモダリティを含むベンチマークテストであり、大規模言語モデルの学術分野におけるパフォーマンスを測定することを目的としています。50カ国以上500以上の機関から約1000名の専門家が貢献した3000問以上の問題を含み、100以上の学問分野を網羅しています。本テストは、モデルの限界に挑戦することで人工知能技術の発展を促進することを目的とした、最終的なクローズド型の学術ベンチマークとなることを目指しています。主な利点はその難易度が高く、複雑な学術問題に対するモデルのパフォーマンスを効果的に評価できる点です。
人類最後の試験 (Humanity's Last Exam) 最新のトラフィック状況
月間総訪問数
202439
直帰率
64.00%
平均ページ/訪問
1.9
平均訪問時間
00:03:36