2024-12-19 17:47:00.AIbase.
大模型评测平台CompassArena升级 推出全新 Judge Copilot 功能
2024-11-06 14:17:46.AIbase.
CMU、Meta联手放大招! VQAScore一个问题搞定文生图模型评测,准确性远超传统方法!
2024-08-13 08:11:01.AIbase.
大模型评测平台Compass Arena新增多模态大模型竞技版块
2023-11-29 09:08:23.AIbase.
“百模大战”家家第一,大模型“跑分”作弊何时休?
2023-11-02 15:21:41.AIbase.
蚂蚁集团发布面向 DevOps 领域的大模型评测基准
2023-09-25 09:54:21.AIbase.
大模型评测乱象调查:参数规模不代表一切
2023-08-29 10:09:08.AIbase.