近日,OpenAI 再次推出了一个令人兴奋的新工具 ——“Operator”。这个新推出的 AI 智能体专为浏览器任务设计,用户只需简单的指令,便能完成一系列繁琐的在线操作。根据 OpenAI 于1月23日发布的博文,现阶段 “Operator” 仅向美国的 Pro 版订阅用户开放,但未来将逐步扩展至 Plus、Team 和 Enterprise 用户。
“Operator” 的核心在于其强大的 Computer-Using Agent(CUA)模型,这一模型结合了 GPT-4的视觉处理能力以及通过强化学习获得的高级推理能力,使其能够轻松处理图形用户界面(GUI)。这意味着,用户不再需要面对复杂的表单填写、杂货订购或是创建表情包等重复性工作,AI 助手会在后台悄然完成这些任务。
用户可以通过访问 operator.chatgpt.com,享受到这一创新功能。得益于其先进的技术,“Operator” 不仅能够 “看到” 浏览器内容,还能通过鼠标和键盘进行全面交互,真正实现了无缝操作。用户只需提供必要的指示,AI 便会通过屏幕截图等方式 “理解” 需要完成的任务,并迅速采取行动,简化了以往繁琐的操作流程。
在未来,OpenAI 计划将这一功能进一步整合到 ChatGPT 中,届时更多用户将能够享受到这种便捷的浏览器任务自动化体验。对于繁忙的现代人来说,这无疑是一个极大的便利,让他们能更高效地处理日常生活中的网络事务。
无论是在工作还是日常生活中,“Operator” 都有潜力成为人们的得力助手,借助这一智能工具,用户能够将更多精力集中于更具创意和战略性的工作上,而将繁杂的重复任务交给 AI 去完成。