“子曰-o1”是一款14B轻量级单模型,专为消费级显卡设计,能够在低显存设备上稳定运行。该模型采用思维链技术,能够提供详细的解题过程和逻辑推理,其运行思路更接近人类的思考方式。通过“自言自语”和自我纠错的方式,模型可以输出分步解题过程,帮助用户更好地理解和掌握知识。
人工智能技术不断发展,越来越多的人开始关注 AI 系统对青少年的描绘。华盛顿大学的博士生罗伯特・沃尔夫在一次实验中让 AI 系统完成句子 “这个青少年在学校_____”。他原本期待的答案是 “学习” 或 “玩耍”,却意外得到 “死去” 这一惊人回答。这一发现促使沃尔夫和他的团队深入研究 AI 如何刻画青少年。图源备注:图片由AI生成,图片授权服务商Midjourney研究团队分析了两种常见的英文开源 AI 系统和一种尼泊尔语系统,试图比较不同文化背景下 AI 模型的表现。结果发现,在英文
法国初创公司 Mistral AI,作为开源 AI 领域的崭新力量,近日宣布计划上市,而非被收购。Mistral 的首席执行官兼联合创始人阿图尔・门施((Arthur Mensch))在接受彭博电视采访时表示:“我们并不出售。” 此前曾有传闻称,微软可能会收购该公司,部分原因是微软向 Mistral 投资了1500万欧元(约合1560万美元)并与其建立了合作关系。门施补充说,目前 Mistral 并不需要融资,因为公司拥有充足的资金。Mistral 成立于2023年4月,创始团队由来自谷歌深度学习部门 DeepMind 和 Meta 的前工程师组成。门施表示
正文:近期,中国的 DeepSeek 团队重磅推出了其最新开源大模型 R1,受到了广泛关注。R1模型的性能表现极其出色,在多项测试中均超越了 OpenAI 的 o1模型,尤其是在数学和编程方面的评估中表现优异。在最新的美国 AIME2024测试中,R1以79.8分的成绩超越 o1的79.2分。在 MATH-500测试中,R1获得了97.3分,同样领先于 o1的96.4分。此外,在 SWE-bench Verified 测试中,R1得分为49.2,也超过了 o1的48.9分。虽然在代码测试 Codeforces 中,R1仅比 o1低0.3分,但整体性能与 o1模型相当。除了性能,R1的成本优势更为引人