k1系列强化学习模型登场！月之暗面Kimi上线视觉思考模型

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年12月16号 10:05

349

月之暗面今日宣布发布全新视觉思考模型k1。这一模型基于强化学习技术，不仅支持端到端的图像理解，还整合了思维链技术，将能力扩展到了数学之外的更多基础科学领域，包括物理和化学。在基准能力测试中，k1模型的表现超越了全球领先的标杆模型，如OpenAI的o1、GPT-4o以及Claude3.5Sonnet。

新一代模型通过激励生成更详细的推理步骤，形成高质量的思维链，显著提升了解决复杂任务的成功率。Kimi的k1模型在图像理解与思考能力上的融合，为用户提供了更流畅的交互体验，能够直接处理用户输入的图像信息并得出答案，无需借助外部的OCR或额外视觉模型。

微信截图_20241216100218.png

k1模型的训练分为两个阶段，首先是预训练得到基础模型，然后在此基础上进行强化学习后训练。基础模型在OCRBench上取得了903分的优异成绩，并在MathVista-testmini、MMMU-val和DocVQA基准测试集中表现突出。强化学习后训练在数据质量和学习效率方面进行了优化，实现了规模化上的新突破。

Kimi还自主构建了一个标准化测试集Science Vista，涵盖不同难度的数理化图片题目，并将开放给全行业使用。尽管k1模型在内部测试中显示出一些局限性，如在分布外泛化、复杂问题上的成功率等方面有提升空间，但其在视觉噪声场景下的表现优于其他模型，显示出超强的视觉识别能力。

Kimi智能助手的k1视觉思考模型不仅在数学领域表现出色，还扩展到了物理和化学领域，展现出了广泛的基础科学能力。此外，k1模型还展现出了通用能力，能够解释和推理非数学问题，如科学家手稿的内容和背景故事。

Kimi智能助手期待与用户一起探索更大的世界，k1新模型已经上线，用户可以通过最新版的Kimi智能助手手机APP或网页版体验这一新功能。

月之暗面发布新一代SOTA模型 k1.5：多模态推理能力再升级

月之暗面公司隆重推出其全新的 SOTA（state-of-the-art）模型 ——k1.5多模态思考模型，标志着在多模态推理和通用推理领域的重大突破。该模型不仅具备出色的多模态处理能力，还展示了卓越的通用推理能力，能够有效应对各类复杂任务。k1.5模型的最大亮点在于其多模态推理能力。它可以同时处理来自文本、图像、声音等不同模态的信息，进而提供更加全面和准确的理解。这一特性使其在视觉问答、视觉常识推理及视觉语言导航等任务中表现尤为出色。举例来说，用户可以通过图像和文本结

DeepSeek推出全新推理模型 DeepSeek-R1 性能比肩OpenAI-o1

近日，DeepSeek 宣布推出其首个通过强化学习（RL）训练的推理模型 DeepSeek-R1，该模型在多个推理基准测试中取得了与 OpenAI-o1-1217相当的性能。 DeepSeek-R1基于 DeepSeek-V3-Base 模型，并采用了多阶段训练和冷启动数据来提高推理能力。DeepSeek 的研究人员首先开发了 DeepSeek-R1-Zero，这是一个完全通过大规模强化学习训练的模型，没有任何监督微调的预备步骤。DeepSeek-R1-Zero 在推理基准测试中展现出卓越的性能，例如在 AIME2024考试中，其 pass@1分数从15.6% 提升至71.0%。然而，DeepSeek-R1-Zero 也存在一些问题

Kimi 发布全新 SOTA 模型： k1.5 多模态思考模型登场

近日，北京月之暗面科技有限公司宣布其旗下智能助手 Kimi 迎来了重大技术升级，推出了全新的 k1.5多模态思考模型。这一模型在多模态推理和通用推理能力上达到了行业领先水平，标志着 Kimi 在人工智能领域的又一次突破性进展。

OpenAI 引领 AI 安全新标准:重磅发布红队测试创新

OpenAI 近日在 AI 安全领域展示了其更为积极的红队测试策略，超越了其竞争对手，尤其是在多步强化学习和外部红队测试这两个关键领域。公司发布的两篇论文为提升 AI 模型的质量、可靠性和安全性设立了新的行业标准。第一篇论文《OpenAI 的 AI 模型与系统外部红队测试方法》指出，外部专业团队在发现内部测试可能遗漏的安全漏洞方面极为有效。这些外部团队由网络安全和特定领域的专家组成，能够识别模型安全边界的缺陷，以及模型中的偏差和控制问题。第二篇论文《多样化和有效的