清华大学推出AutoDroid-V2:移动设备上 AI 自动化控制的新突破

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · 2025年1月2号 17:51

304

近日，清华大学智能产业研究院（AIR）在2024年12月24日发布了一项名为 AutoDroid-V2的 AI 模型，旨在优化移动设备的自动化控制能力。该模型通过小型语言模型的应用，显著提升了用户通过自然语言进行操作的效率。

AutoDroid-V2采用了一种基于脚本的方法，与传统依赖云端大型语言模型（LLM）的方式不同。这一创新使得设备能够高效执行用户指令，减少了对云服务的依赖，从而在隐私和安全性方面有了显著的提升。同时，它也降低了用户端的流量消耗及服务器端的运行成本，推进了移动设备的广泛应用。

在项目背景上，近年来，大型语言模型和视觉语言模型的崛起使得通过自然语言命令控制移动设备成为可能。这些技术为复杂用户任务的解决提供了新的途径。然而，传统的 “逐步 GUI 智能体” 方法存在着高流量消耗和隐私安全风险的问题，使得大规模部署面临障碍。

AutoDroid-V2的创新之处在于，它能够根据用户指令生成多步骤脚本，进而一次性执行多个 GUI 操作。这种方式大幅减少了查询频率，降低了资源消耗，并且能够在用户设备上直接生成和执行任务脚本。该模型在离线状态下会构建应用程序文档，为后续的脚本生成打下基础。

在性能测试中，AutoDroid-V2在23款移动应用上进行了226项任务的基准测试，相较于之前的模型，如 AutoDroid 和 SeeClick 等，任务完成率提升了10.5% 到51.7%。此外，其输入和输出的 token 消耗分别减少至43.5分之一和5.8分之一，模型推理延迟降低至原来的5.7到13.4分之一。这些成果显示了 AutoDroid-V2在实际应用中的高效性和可靠性。

划重点:
🌟 AutoDroid-V2是清华大学推出的新 AI 模型，提升了移动设备的自然语言控制效率。
🔒 该模型通过小型语言模型减少了对云端服务的依赖，增强了用户隐私和安全性。
📈 基准测试显示，AutoDroid-V2在任务完成率和资源消耗上均有显著改善，展现出强大的应用潜力。

Figure AI推出革命性双机协作AI模型Helix，赋能人形机器人新未来

在机器人技术领域，美国创业公司 Figure AI 于近期发布了一款名为 Helix 的端侧大模型，标志着人形机器人控制技术的重大突破。Helix 是首个能够对整个人形机器人上半身（包括头部、躯干、手腕和手指）进行高频率、连续控制的视觉 - 语言 - 动作(VLA)模型。这意味着，机器人可以在无需大量训练的情况下，直接根据自然语言指令执行任务。Figure AI 通过建立两个互补的系统来解决视觉语言模型的通用性和速度之间的矛盾。系统一是一个快速反应的视觉运动策略模型，能够每秒执行200次精确动

新一代生物AI模型Evo 2揭开基因密码，助力疾病研究

近日，由 Arc Institute 和 Nvidia 联合开发的 Evo2生物 AI 模型正式发布。这一基础模型基于超过10万种生物的 DNA 数据，旨在深度解码生物学中的各种复杂现象。Evo2能够在不同生物体的基因序列中识别出研究者们需要花费多年时间才能发现的模式，极大提升了疾病相关突变的识别能力，并可以设计出与简单细菌相当的全新基因组。Evo2的训练涉及超过93万亿个核苷酸的处理，远超其前身 Evo1。其开发团队来自 Nvidia 和位于加州帕洛阿尔托的非营利生物医学研究机构 Arc Institute，还与斯坦福大学、加州

警惕！马斯克的新AI模型Grok 3被曝存在严重安全漏洞，黑客可轻松操控！

AI 安全公司 Adversa AI 发布了一项令人震惊的报告，称埃隆・马斯克的创业公司 xAI 刚发布的 Grok3模型在网络安全方面存在重大漏洞。Adversa 的研究团队发现，这款最新的 AI 模型容易受到 “简单的越狱攻击”，这可能使不法分子能够获取诸如 “如何诱骗儿童、处理尸体、提取 DMT 以及制造炸弹” 等敏感信息。更糟糕的是，Adversa 的首席执行官兼联合创始人亚历克斯・波利亚科夫表示，这次漏洞不仅仅是越狱攻击那么简单，他们还发现了一种新的 “提示泄露” 缺陷，暴露了 Grok 模型的完整系

AI新闻资讯

清华大学推出AutoDroid-V2:移动设备上 AI 自动化控制的新突破

AIbase基地

相关AI新闻推荐

Figure AI推出革命性双机协作AI模型Helix，赋能人形机器人新未来

新一代生物AI模型Evo 2揭开基因密码，助力疾病研究

xAI称已面向所有用户免费提供 Grok3 直到他们服务器崩溃

警惕！马斯克的新AI模型Grok 3被曝存在严重安全漏洞，黑客可轻松操控！