OpenCompass 2.0 Large Language Model Leaderboard
大型语言模型排行榜,实时评估模型性能。
普通产品生产力评估排行榜
OpenCompass 2.0是一个专注于大型语言模型性能评估的平台。它使用多个闭源数据集进行多维度评估,为模型提供整体平均分和专业技能分数。该平台通过实时更新排行榜,帮助开发者和研究人员了解不同模型在语言、知识、推理、数学和编程等方面的性能表现。
OpenCompass 2.0 Large Language Model Leaderboard 最新流量情况
月总访问量
31012
跳出率
34.96%
平均页面访问数
2.7
平均访问时长
00:02:09