微软推新模型LAM：让AI实现真实操作在Word中独立执行任务

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2025年1月3号 10:32

599

正微软的研究团队近日推出了一种被称为 “大型行动模型”（Large Action Model，简称 LAM）的人工智能技术，标志着 AI 的发展迎来了新的阶段。与传统的语言模型如 GPT-4o 不同，LAM 能够自主操作 Windows 程序，这意味着 AI 不仅仅能对话或提供建议，而是能真实地执行任务。

LAM 的优势在于其能够理解用户的各种输入，包括文字、语音和图像，然后将这些请求转化为详细的步骤计划。LAM 不仅能制定计划，还能根据实时情况调整其行动策略。构建 LAM 的过程主要分为四个步骤:首先，模型学习将任务分解为逻辑步骤;接着，通过更先进的 AI 系统（如 GPT-4o）学习如何将这些计划转化为具体行动;然后，LAM 会独立探索新的解决方案，甚至解决其他 AI 系统无法应对的问题;最后，通过奖励机制进行微调训练。

在实验中，研究团队以 Mistral-7B 为基础构建了一个 LAM 模型，并在 Word 测试环境中进行测试。结果显示，该模型成功完成任务的概率为71%，相比之下，GPT-4o 在无视觉信息的情况下的成功率为63%。

此外，LAM 在任务执行速度上也表现优异，每个任务仅需30秒，而 GPT-4o 则需要86秒。虽然在处理视觉信息时，GPT-4o 的成功率提高至75.5%，但总体来看，LAM 在速度和效果上均有显著优势。

为了构建训练数据，研究团队最初收集了29，000对任务和计划的示例，这些数据来自微软文档、wikiHow 文章和必应搜索。之后，他们利用 GPT-4o 将简单任务转化为复杂任务，从而将数据集扩展到76，000对，增加了150%。最终，约2，000个成功的行动序列被纳入到最终的训练集中。

尽管 LAM 展示了其在 AI 发展中的潜力，研究团队仍然面临一些挑战，如 AI 行动可能出错的问题、监管的相关问题，以及在不同应用中扩展和适应的技术限制。不过，研究人员相信，LAM 代表了 AI 发展的一次重要转变，预示着人工智能助手将能更积极地协助人类完成实际任务。

划重点:
🌟 LAM 能够自主执行 Windows 程序，突破传统 AI 只会对话的局限。
⏱️ 在 Word 测试中，LAM 成功完成任务的概率达到71%，比 GPT-4o 的63% 更高，且执行速度更快。
📈 研究团队通过数据扩展策略，将任务计划对的数量增加到76，000对，进一步提升了模型的训练效果。

网信办发布2025年“清朗”系列专项行动整治AI技术滥用乱象

今日，中央网信办发布2025年“清朗”系列专项行动整治重点称，2025年，“清朗”系列专项行动将进一步巩固提升治理成效，聚焦人民群众反映强烈的突出问题，在破解难点瓶颈方面下功夫，强化源头管理和基础管理;在治理创新方面下功夫，针对性细化每个专项打法举措;在维护网民权益方面下功夫，严厉打击各类侵权违法行为，营造更加清朗有序的网络环境。

马斯克的xAI推出 Grok 3，免费体验直至服务器崩溃！

北京时间2月20日，马斯克创立的人工智能公司 xAI 宣布其最新的 Grok3模型正式开放免费使用，用户可以在不支付任何费用的情况下体验这一先进的 AI 技术，直至服务器承载能力达到极限。这一举动引起了广泛关注，尤其是在当前竞争激烈的 AI 市场中。Grok3的推出标志着 xAI 在 AI 领域的又一重要进展。用户只需登录即可体验这一强大的 AI 工具，而那些订阅了 X Premium + 和 SuperGrok 服务的用户则能够享受更多高级功能，包括语音模式等独特体验。此外，订阅用户还将获得 Grok3的深度使用权限，这

苹果发布599美元 iPhone 16e，搭载自家AI功能，2月28日上市

苹果公司于近日正式推出了期待已久的第四代iPhone SE的升级版本 ——iPhone16e。与以往不同的是，这款设备不再使用 “SE” 品牌名称，而是直接与苹果的旗舰系列保持一致。新机型的起售价为599美元，预计将于2月28日开始发货。iPhone16e 的一大亮点是其搭载的 “苹果智能”（Apple Intelligence），这是一种类似于 OpenAI 的 ChatGPT 和谷歌的 Gemini 的 AI 技术。该技术能在设备本地运行，提供文本摘要、写信和生成图像等功能，增强了用户的交互体验。此外，iPhone16e 成为与其他 iPhone16系列和 iPhone15Pro

Netflix 使用 AI 克隆被谋杀受害者声音引发公众愤怒

近日，Netflix 在其新推出的真实犯罪纪录片《美国谋杀:加比・佩蒂托》中，因使用 AI 技术重现已故社交媒体影响者加比・佩蒂托的声音而引发了广泛争议。加比于2021年8月被其未婚夫布莱恩・劳德里谋杀，令公众深感痛心。在纪录片开头，观众注意到了一则提示，称佩蒂托的日记和短信将通过语音重现技术以她的声音进行演绎。图源备注：图片由AI生成，图片授权服务商Midjourney这一艺术选择引发了观众的强烈反响，许多人表示感到不安。一名观众在社交媒体上写道:“我一直很投入，直到看

AI新闻资讯

微软推新模型LAM：让AI实现真实操作 在Word中独立执行任务

AIbase基地

相关AI新闻推荐

网信办发布2025年“清朗”系列专项行动 整治AI技术滥用乱象

马斯克的xAI推出 Grok 3，免费体验直至服务器崩溃！

苹果发布599美元 iPhone 16e，搭载自家AI功能，2月28日上市

​Netflix 使用 AI 克隆被谋杀受害者声音引发公众愤怒

微软推新模型LAM：让AI实现真实操作在Word中独立执行任务

网信办发布2025年“清朗”系列专项行动整治AI技术滥用乱象

Netflix 使用 AI 克隆被谋杀受害者声音引发公众愤怒