正文:近期,中国的 DeepSeek 团队重磅推出了其最新开源大模型 R1,受到了广泛关注。R1模型的性能表现极其出色,在多项测试中均超越了 OpenAI 的 o1模型,尤其是在数学和编程方面的评估中表现优异。

image.png

最新的美国 AIME2024测试中,R1以79.8分的成绩超越 o1的79.2分。在 MATH-500测试中,R1获得了97.3分,同样领先于 o1的96.4分。此外,在 SWE-bench Verified 测试中,R1得分为49.2,也超过了 o1的48.9分。虽然在代码测试 Codeforces 中,R1仅比 o1低0.3分,但整体性能与 o1模型相当。

除了性能,R1的成本优势更为引人注目。OpenAI 的 o1模型每100万 tokens 的输入费用高达15美元,而 R1的费用仅为0.14美元,成本降低了90%。在输出方面,o1的费用为60美元每100万 tokens,而 R1仅需2.19美元,降低幅度达到27倍。这一巨大的成本差异,让 R1在开源大模型领域中脱颖而出。

在 DeepSeek 团队宣布 R1开源后,许多国外网友纷纷表达了对这一模型的赞叹,认为 R1在性价比和性能方面都超越了 Meta、Mistral 等老牌开源平台。许多人表示,R1模型的高效推理能力使其在代码编写和数学解释等方面表现优异,甚至有用户称其为 “最像人类内心独白的模型”。同时,苹果公司的机器学习研究员 Awni Hannun 也对 R1进行了测试,发现其在苹果 M2Ultra 上运行迅速且推理效率高。

R1模型的开发经历了多个阶段的训练流程,包括冷启动数据和多阶段训练,以提高其推理能力和可读性。这些技术改进确保了 R1模型在各种任务中的卓越表现。

随着 R1的发布,中国的开源大模型在国际市场上再次引起了极大的关注与讨论,许多技术爱好者对此模型的潜力表示期待。R1的发布标志着中国在大模型技术领域的进一步突破,推动了开源技术的发展。

开源地址:https://huggingface.co/deepseek-ai/R1

API:https://api-docs.deepseek.com/guides/reasoning_model

划重点:

🌟 R1模型在多项测试中超越 OpenAI 的 o1,显示出卓越的性能表现。  

💰 R1的输入和输出成本分别低至0.14美元和2.19美元,成本降低幅度达90%。  

🚀 R1开源后受到广泛关注,许多国外专家对其性能表示赞赏,认为其性价比超高。