“子曰-o1”是一款14B轻量级单模型,专为消费级显卡设计,能够在低显存设备上稳定运行。该模型采用思维链技术,能够提供详细的解题过程和逻辑推理,其运行思路更接近人类的思考方式。通过“自言自语”和自我纠错的方式,模型可以输出分步解题过程,帮助用户更好地理解和掌握知识。
法国初创公司 Mistral AI,作为开源 AI 领域的崭新力量,近日宣布计划上市,而非被收购。Mistral 的首席执行官兼联合创始人阿图尔・门施((Arthur Mensch))在接受彭博电视采访时表示:“我们并不出售。” 此前曾有传闻称,微软可能会收购该公司,部分原因是微软向 Mistral 投资了1500万欧元(约合1560万美元)并与其建立了合作关系。门施补充说,目前 Mistral 并不需要融资,因为公司拥有充足的资金。Mistral 成立于2023年4月,创始团队由来自谷歌深度学习部门 DeepMind 和 Meta 的前工程师组成。门施表示
正文:近期,中国的 DeepSeek 团队重磅推出了其最新开源大模型 R1,受到了广泛关注。R1模型的性能表现极其出色,在多项测试中均超越了 OpenAI 的 o1模型,尤其是在数学和编程方面的评估中表现优异。在最新的美国 AIME2024测试中,R1以79.8分的成绩超越 o1的79.2分。在 MATH-500测试中,R1获得了97.3分,同样领先于 o1的96.4分。此外,在 SWE-bench Verified 测试中,R1得分为49.2,也超过了 o1的48.9分。虽然在代码测试 Codeforces 中,R1仅比 o1低0.3分,但整体性能与 o1模型相当。除了性能,R1的成本优势更为引人
DeepSeek近日正式发布并开源了其最新研发的大型语言模型R1,该模型在性能上表现出色,被认为可与OpenAI的o1正式版相媲美。这一举措不仅标志着国产AI技术的又一次重大突破,也为全球AI开发者带来了新的选择。DeepSeek R1在后训练阶段大规模应用了强化学习技术,即便是在极少标注数据的情况下,也显著提升了模型的推理能力。在数学、代码、自然语言推理等关键任务上,DeepSeek R1的性能均能与OpenAI o1正式版平分秋色,展示了其强大的实力。为了回馈开源社区,DeepSeek同时开源了DeepSeek-R1和De