今天,阿里云通义团队正式发布了全新的数学推理过程奖励模型 Qwen2.5-Math-PRM。该模型提供了72B 和7B 两种尺寸,性能表现均显著优于同类的开源过程奖励模型,尤其是在识别推理错误方面表现突出。Qwen2.5-Math-PRM 的7B 版本令人惊讶地超越了业界广受欢迎的 GPT-4o,这一成就标志着阿里云在推理模型的研发上迈出了重要的一步。为了全面评估模型在数学推理中的表现,通义团队还开源了首个步骤级的评估标准 ——ProcessBench。这个评估标准涵盖了3400个数学问题测试案例,其中还包括国际奥林匹
阿里云正式上线了其全新的通义灵码 AI 程序员 ,标志首个能够同时支持 VS Code 和 JetBrains IDEs 开发工具的 AI 编程产品的问世。这款 AI 程序员工具,拥有比传统辅助编程工具更强大的能力,帮助开发者以更高效的方式完成编码任务。通义灵码 AI 程序员通过全程对话协作的方式,能够轻松实现从零开始的业务需求开发、问题修复以及单元测试批量生成等复杂的编码任务。开发者可以与 AI 程序员进行互动,轻松指令并修改代码。该工具的底层模型已升级至 Qwen2.5-coder,其代码生成的准确性和速
近日,阿里云宣布与传音控股达成战略合作,旗下科技品牌 TECNO 将首款搭载通义千问大模型的 AI 手机 PHANTOM V Fold2正式上市。这款手机的亮点在于其独特的 AI 按键设计,用户可通过该按键一键召唤强大的 AI 助手,即使在离线环境下,仍能实现流畅的多轮对话,支持文档和通话的智能摘要功能。传音控股是一家在非洲市场颇具影响力的中国手机制造商,产品涵盖 TECNO、iTel 和 Infinix 三个主要品牌。根据数据显示,传音在2023年的全球智能手机市场占有率达8.1%,位列第五,在非洲、巴基斯坦、
近日,传音控股与阿里云达成合作,将通义千问大模型搭载在传音旗下科技品牌TECNO推出的AI手机PHANTOM V Fold2中,成功打造了深度本地化的“实用型AI”。这款手机通过特定的AI按键,用户可以一键调用端侧大模型,在离线环境中也能流畅运行多轮AI对话,并实现文档及通话摘要等功能。传音与阿里云在该款手机上基于联发科芯片进行了大量技术创新,包括模型瘦身、工具链优化、推理优化和内存优化等多个维度的合作。