Meta科学家开发"思维提炼"技术语言模型性能显著提升

AIbase

发布于AI新闻资讯 · 1 分钟阅读 · Jul 11, 2024

149

近期一项研究表明，通过特殊训练，语言模型可以部分实现更高效的多步骤推理能力。这种能力类似于心理学家丹尼尔·卡尼曼所描述的"系统2推理"，即缓慢而有意识的信息处理方式。

Meta公司的研究人员开发出一种新方法，将计算密集型的多步骤推理过程"提炼"为语言模型的参数。研究结果显示，在某些情况下，经过这种方法训练的模型能够以更低的计算成本达到与原始多步骤过程相似的性能。

这种"提炼"方法的工作原理是:首先对大量示例数据应用多步骤推理方法，然后筛选并保留一致性高的结果，最后使用这些数据对语言模型进行微调训练。本质上，该方法通过生成合成训练数据，使语言模型能够直接得出结论而无需中间步骤。

人工智能大脑，大模型

图源备注：图片由AI生成，图片授权服务商Midjourney

研究人员将这种方法应用于四种不同的多步骤推理技术和五种任务类型。结果表明，在许多情况下这种方法都能有效提升模型性能，但并非适用于所有场景。

例如，在避免偏见和改善回应质量等任务中，经过"提炼"的模型表现与多步骤方法相当，但所需计算资源大幅减少。然而，在复杂的数学推理任务中，这种方法却未能奏效。研究人员推测，某些任务对于单步推理来说可能过于复杂。

尽管如此，研究人员认为这种方法为开发更强大的语言处理系统提供了一个有前景的方向。未来可以将这种方法与其他技术相结合，专注于解决真正具有挑战性的问题。

这项研究为提升语言模型的推理能力开辟了新的路径，有望在多个应用领域带来突破。

1. "多步骤推理"2. "系统2推理"3. "计算密集型"4. "提炼训练"

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

谷歌 DeepMind 发布 Gemma Scope 2：为 Gemma 3 模型提供全栈可解释性工具

谷歌DeepMind推出Gemma Scope2，这是一个开放的可解释性工具套件，旨在深入分析Gemma3语言模型从2.7亿到270亿参数的各层次信息处理。该工具帮助AI安全与对齐团队追踪模型内部特征，以应对“越狱”、幻觉或不当行为等问题。

2025年12月23号 15:18

钉钉发布全球首个 AI 工作智能操作系统 Agent OS

钉钉发布全球首个AI工作智能操作系统Agent OS，开启“人与AI协同”新工作方式。该系统在AI钉钉1.1新品发布暨生态大会上亮相，命名为“木兰”，是继1.0版本“蕨”后的重要升级，展现了钉钉在企业级AI生态中的创新布局。

2025年12月23号 13:52

580

Quest Mobile发布AI应用周活排行榜：字节系上榜3个，蚂蚁上榜2个

Quest Mobile报告显示，2025下半年AI应用生态中，豆包、DeepSeek、元宝、蚂蚁阿福位列周活跃用户前四，阿里千问第五，蚂蚁灵光进入前十。Top10榜单中通用AI占6席，垂类专业AI占4席，呈现通用与垂直场景并进格局。

2025年12月23号 10:54

240

谷歌推出 A2UI 标准，让 AI 实时生成用户界面

谷歌推出A2UI新标准，让AI能直接生成图形界面元素，如按钮和表单，提升交互体验。传统AI交互依赖文本，处理复杂任务繁琐。A2UI开源项目规范AI生成视觉响应，使客服等场景能即时创建界面，简化操作流程。

2025年12月22号 16:50

630

AI日报：千问发布分层图像编辑模型Qwen-Image-Layered；Kling2.6新增语音控制和动作控制功能；谷歌推出A2UI开放标准

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、阿里通义千问Qwen发布分层图像编辑模型Qwen-Image-Layered，一键生成“Photoshop图层”阿里通义千问Qwen发布了分层图像编辑模型Qwen-Image-Layered，该模型能够将静态照片分解为多个具有透明背景的独立RGBA图层，使AI图像编辑具备类似Photoshop的结构化操作能力。文章介绍了PromptFill这一开源结构化提示词生成工具，通过填空式交互降低AI绘画的门槛，解决复杂Prompt编写难题，并强调其在提升创作效率和隐私保护方面的优势。

2025年12月22号 16:23