据第一财经报道,DeepSeek 开源大模型 DeepSeek-V2的关键开发者罗福莉将加入小米,担任小米 AI 实验室的领导,并负责大模型团队的建设。这一消息引起了广泛关注,尤其是在小米计划加强其在大模型领域的布局之际。图源备注:图片由AI生成,图片授权服务商Midjourney据知情人士透露,小米创始人雷军对公司在 AI 大模型领域的起步较晚表示担忧,因此决定高薪挖角罗福莉。罗福莉的背景相当亮眼,她拥有北京大学计算语言学研究所的硕士学位,并在自然语言处理领域的顶级会议 ACL2019上发表了
据智能涌现消息,中国大模型独角兽阶跃星辰近日完成数亿美元B轮融资,核心投资方包括上海国有资本投资有限公司及旗下基金,腾讯投资、五源资本、启明创投等战略和财务投资人也参与其中。这笔资金将主要用于基础模型研发,进一步提升多模态和复杂推理能力,并拓展C端应用场景。作为国内大模型“六小虎”之一,阶跃星辰以技术扎实和高效产出著称。其自研的Step系列模型涵盖语言、图像、视频及语音等多种模态,并在多个权威榜单上名列前茅。例如,在LiveBench和LMSYS Chatbot Arena的
百川智能发布全链路领域增强大模型Baichuan4-Finance。据介绍, 通过行业首创的领域自约束训练方案,Baichuan4-Finance实现了金融能力和通用能力同步提升的效果,极大提高了金融场景的整体可用性。图源备注:图片由AI生成,图片授权服务商Midjourney据媒体报道,内部人士透露,其金融专业能力和场景应用能力大幅领先GPT-4o,在中国人民大学财政金融学院新近发布的评测体系FLAME以及国内主流开源金融评测基准FinancelQ上均登上榜首。值得一提的是,今年五月份,百川智能发布基座大模型Baichuan4,
OpenAI 正式发布了其最新的 o-Model 推理系列模型 ——OpenAI o3。作为继任者,o3在数学和科学推理方面展现了显著的进步,引发了业界对其能力与局限性的广泛讨论。OpenAI 表示,o3的设计旨在提升处理结构化思维需求的推理能力,尤其是在数学和科学领域。该模型在一项专门的推理基准测试 ARC AGI 中表现优异,得分从之前模型的32% 跃升至87%。这一进步标志着 o3在解决复杂逻辑和数学问题上的能力有了显著提升。o3的性能表现尤为引人关注。在高级数学测试中,o3的成功率达到96.7%,相比之前的