2025-03-17 11:43:55.AIbase.16.3k
小米大模型团队登顶音频推理 MMAU 榜,受到DeepSeek-R1启发
小米技术官方微博宣布,小米大模型团队在音频推理领域取得了显著进展。他们在受到 DeepSeek-R1的启发后,率先将强化学习算法应用于多模态音频理解任务。团队在短短一周内便以64.5% 的 SOTA(State Of The Art)准确率,登顶国际权威的 MMAU 音频理解评测榜,并同步将相关技术开源。MMAU(Massive Multi-Task Audio Understanding and Reasoning)评测集是一个测试音频推理能力的重要标准,涵盖了一万条语音、环境音和音乐样本,旨在考察模型在多种技能上的表现。人类专家在该评测集上的准确率为82.23%,而