OpenCompass 2.0 大規模言語モデルランキング
大規模言語モデルのパフォーマンスをリアルタイムで評価するランキングです。
一般製品生産性評価ランキング
OpenCompass 2.0は、大規模言語モデルのパフォーマンス評価に特化したプラットフォームです。複数のクローズドソースデータセットを用いて多角的な評価を行い、モデル全体の平均スコアと専門スキルスコアを提供します。リアルタイムでランキングを更新することで、開発者や研究者は言語、知識、推論、数学、プログラミングなどの分野における様々なモデルのパフォーマンスを把握できます。
OpenCompass 2.0 大規模言語モデルランキング 最新のトラフィック状況
月間総訪問数
49057
直帰率
42.49%
平均ページ/訪問
2.7
平均訪問時間
00:01:57