AI产品榜

AI产品榜

搜索全球AI产品动态

搜索全球AI信息，发现AI新机遇

新闻资讯
产品应用
变现案例
AI教程

类型 :

新闻资讯
产品应用
变现案例
AI教程

2025-01-16 15:46:26.AIbase

阿里云发布全新数学推理模型Qwen2.5-Math-PRM，7B 版本超越 GPT-4o

今天，阿里云通义团队正式发布了全新的数学推理过程奖励模型 Qwen2.5-Math-PRM。该模型提供了72B 和7B 两种尺寸，性能表现均显著优于同类的开源过程奖励模型，尤其是在识别推理错误方面表现突出。Qwen2.5-Math-PRM 的7B 版本令人惊讶地超越了业界广受欢迎的 GPT-4o，这一成就标志着阿里云在推理模型的研发上迈出了重要的一步。为了全面评估模型在数学推理中的表现，通义团队还开源了首个步骤级的评估标准 ——ProcessBench。这个评估标准涵盖了3400个数学问题测试案例，其中还包括国际奥林匹

阿里云发布全新数学推理模型Qwen2.5-Math-PRM，7B 版本超越 GPT-4o

2025-01-16 10:42:26.AIbase

阿里巴巴Qwen 团队发布新型过程奖励模型，数学推理再进化

阿里巴巴 Qwen 团队近日发布了题为《数学推理中过程奖励模型的开发经验教训》的论文，并推出了 Qwen2.5-Math-PRM 系列中的两个新模型，分别具有7B 和72B 参数。这些模型在数学推理中突破了现有 PRM 框架的限制，通过创新技术显著提高了推理模型的准确性和泛化能力。数学推理一直是大型语言模型（LLM）面临的重大挑战，尤其是在中间推理步骤中，错误往往会影响最终输出的准确性，这对于教育、科学计算等对精确度要求高的领域尤其成问题。传统评估方法，如 Best-of-N(BoN)策略，无法充分捕

阿里巴巴Qwen 团队发布新型过程奖励模型，数学推理再进化

2024-11-18 07:58:19.AIbase

Kimi推出数学推理模型k0-math：数学能力对标OpenAI o1系列

月之暗面Kimi智能助手宣布推出新一代数学推理模型k0-math。k0-math模型在多项数学基准能力测试中表现突出，其成绩在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中超过了OpenAI o1系列的o1-mini和o1-preview模型。

Kimi推出数学推理模型k0-math：数学能力对标OpenAI o1系列