近日,有消息称 OpenAI 即将推出一款名为 “Operator” 的 AI 工具,该工具具备控制个人电脑并代为执行任务的能力。软件工程师 Tibor Blaho 在社交媒体上透露了这一消息,称他发现了关于这款工具的最新线索。此前,包括《彭博社》在内的多家媒体曾报道过 “Operator” 的传闻,称其能够自主完成如编写代码和预定旅行等多项任务。
据 Blaho 透露,OpenAI 计划在2025年1月发布 “Operator”。他发现 OpenAI 的 ChatGPT macOS 客户端中新增了隐秘选项,可以定义 “切换 Operator” 和 “强制退出 Operator” 的快捷键。此外,OpenAI 的网站上也已经出现了 “Operator” 的相关信息,尽管这些信息目前尚未对外公开。
Blaho 还提到,OpenAI 网站上有一些比较 “Operator” 与其他计算机使用 AI 系统性能的表格,这些表格可能只是占位符。如果表格中的数据准确,那么显示 “Operator” 的表现并不总是可靠,具体依赖于执行的任务。
在 OSWorld 的一项基准测试中,“OpenAI 计算机使用代理(CUA)” 的得分为38.1%,虽然超越了 Anthropic 的计算机控制模型,但仍远低于人类的72.4% 得分。在 WebVoyager 的测试中,Operator 的表现超过了人类,而在 WebArena 的测试中则不及人类的表现。对于一些简单的任务,例如注册云服务提供商并启动虚拟机,Operator 的成功率仅为60%;而在创建比特币钱包的任务中,其成功率仅为10%。
OpenAI 进入 AI 代理市场的时机恰逢其他竞争对手如 Anthropic、谷歌等也在争相推出类似技术。尽管 AI 代理目前仍处于初级阶段,但市场分析公司 Markets and Markets 预计,到2030年,AI 代理市场的价值将达到471亿美元。
虽然目前的 AI 代理技术仍然较为基础,但一些专家对其潜在的安全隐患表示担忧。Blaho 透露的数据显示,Operator 在某些安全评估中表现良好,能够有效应对试图让系统执行 “非法活动” 或搜索 “敏感个人数据” 的测试。安全测试被认为是 Operator 开发周期较长的原因之一。
OpenAI 的联合创始人 Wojciech Zaremba 曾在社交媒体上批评 Anthropic 发布的代理缺乏安全保障,他表示如果 OpenAI 发布类似产品,可能会引发负面反响。
划重点:
🔍 OpenAI 即将发布的 “Operator” 工具能自主控制电脑执行任务,如编写代码和预定旅行。
🛠️ 根据泄露信息,Operator 在部分任务上的成功率相对较低,且表现不及人类。
⚠️ 尽管 Operator 在安全评估中表现较好,但专家对其潜在的安全隐患表示关注。