像人脑一样思考！Meta 新模型Dualformer融合快慢思维，推理能力大幅提升

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2024年10月17号 14:15

208

Meta 的 FAIR 团队最近推出了一款名为 Dualformer 的全新 Transformer 模型，该模型模仿人类的双重认知系统，能够无缝整合快速和慢速推理模式，在推理能力和计算效率上取得了显著突破。

人类的思维过程通常被认为是由两种系统控制的:系统1快速直观，系统2则更慢但更具逻辑性。

传统的 Transformer 模型通常只模拟了系统1或系统2中的一种，导致模型要么速度快但推理能力差，要么推理能力强但速度慢且计算成本高。

Dualformer 的创新之处在于其训练方式。研究人员利用随机推理轨迹对模型进行训练，在训练过程中随机丢弃轨迹的不同部分，类似于分析人类思维过程并创建捷径。这种训练策略使 Dualformer 能够在推理时灵活切换不同的模式:

快速模式: Dualformer 只输出最终解决方案，速度极快。

慢速模式: Dualformer 会输出完整的推理链和最终解决方案，推理能力更强。

自动模式: Dualformer 可以根据任务的复杂程度自动选择合适的模式。

实验结果表明，Dualformer 在迷宫导航和数学问题求解等任务上表现出色。在慢速模式下，Dualformer 能够以97.6% 的成功率解决30x30的迷宫导航任务，超越了只使用完整推理轨迹训练的 Searchformer 模型，同时推理步骤减少了45.5%。

在快速模式下，Dualformer 的成功率也高达80%，远高于只使用最终解决方案训练的 Solution-Only 模型。在自动模式下，Dualformer 则能够在保持高成功率的同时，显著减少推理步骤。

Dualformer 的成功表明，将人类认知理论应用于人工智能模型设计能够有效提升模型的性能。这种融合快慢思维的模式为构建更强大、更高效的 AI 系统提供了新的思路。

论文地址：https://arxiv.org/pdf/2410.09918

xAI 新模型 Grok 3 逻辑推理能力获 OpenAI 创始人点赞

埃隆・马斯克的人工智能公司 xAI 于本周一发布了其最新的语言模型 Grok3，标志着该公司在人工智能领域的重要进展。据马斯克介绍，新模型所需的计算能力是其前身的十倍，使用了位于孟菲斯的数据中心，配备了约20万块 GPU。Grok3系列模型推出了多种变体，其中包括一个精简版，旨在提高速度但牺牲部分准确性。此外，新的 “推理” 模型专门设计用于解决数学和科学问题。用户可以通过 Grok 界面中的 “思考” 和 “大脑” 设置来调整这些功能。xAI 表示，这一版本尚未最终定型，模型仍

Anthropic即将发布全新 AI 模型，推理能力再上新台阶

AI 初创公司Anthropic正准备推出其最新的 AI 模型，预计将在未来几周内正式发布。根据theinformation报道，这款新模型被称为 “混合型” 模型，具备在 “深度推理” 与快速响应之间切换的能力。这一创新设计旨在为开发者提供更加灵活的工具，以满足不同应用场景的需求。与之前的版本相比，Anthropic的新模型在处理复杂任务时表现出色。它的深度推理能力将使其能够更好地理解和分析复杂的数据，从而提升工作效率。同时，该模型将配备一个 “滑动比例” 功能，允许开发者根据需求调节计

DeepSeek-R1 模型幻觉问题严重，推理能力与准确性面临挑战

近日，Vectara 的机器学习团队对 DeepSeek 系列的两款模型进行了深入的幻觉测试，结果显示，DeepSeek-R1的幻觉率高达14.3%，显著高于其前身 DeepSeek-V3的3.9%。这表明，在增强推理的过程中，DeepSeek-R1产生了更多不准确或与原始信息不一致的内容。该结果引发了对推理增强大语言模型（LLM）产生幻觉率的广泛讨论。图源备注:图片由AI生成，图片授权服务商Midjourney研究团队指出，推理增强模型可能会比普通的大语言模型更容易产生幻觉。这一现象在 DeepSeek 系列与其他推理增强模型的比较中表现得尤

谷歌即将推出全新升级版Gemini AI模型，推理能力大幅提升

谷歌近日宣布，将于2025年1月23日发布其全新升级的 AI 模型 ——“Gemini2.0Flash Thinking Exp-0123”。该模型是现有 “Exp-1219” 的进一步优化，主要聚焦于增强推理能力以及思维透明度。随着 AI 技术的迅猛发展，谷歌致力于通过此次升级，让机器不仅能够生成答案，更能够清晰地展现出其思考过程，极大提升了用户对 AI 工作原理的理解。Gemini2.0的一大亮点在于其能够生成 “思考过程”，这一功能将为开发者和研究人员提供更大的便利。通过集成到 Google AI Studio，开发者可以利用这一工具进行更

AI新闻资讯