DeepSeek近日正式发布并开源了其最新研发的大型语言模型R1,该模型在性能上表现出色,被认为可与OpenAI的o1正式版相媲美。这一举措不仅标志着国产AI技术的又一次重大突破,也为全球AI开发者带来了新的选择。

DeepSeek R1在后训练阶段大规模应用了强化学习技术,即便是在极少标注数据的情况下,也显著提升了模型的推理能力。在数学、代码、自然语言推理等关键任务上,DeepSeek R1的性能均能与OpenAI o1正式版平分秋色,展示了其强大的实力。

image.png

为了回馈开源社区,DeepSeek同时开源了DeepSeek-R1和DeepSeek-R1-Zero两款模型,均采用660B参数规模。此外,DeepSeek还通过模型蒸馏技术,开源了6个小模型,其中包括32B和70B参数的模型。这些小模型在多项能力上超越了OpenAI的o1-mini,进一步丰富了开源生态。

image.png

在API定价方面,DeepSeek也展现了其开放的姿态:缓存命中每百万输入tokens仅需1元,未命中则为4元;输出tokens每百万定价为16元,整体定价更具竞争力。

image.png

更为重要的是,DeepSeek R1采用了标准的MIT License,允许用户无限制商用。同时,DeepSeek还鼓励用户利用R1的输出结果训练其他模型,进一步推动AI技术的普及和发展。DeepSeek R1的开源,无疑将为全球开发者带来更强大的工具,也为AI技术的创新和应用注入新的活力,预示着AI技术平权化时代的加速到来。

论文:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

API文档:https://api-docs.deepseek.com/zh-cn/guides/reasoning_model