据最新报道,Emergence AI 公司推出了一款名为 Agent-E 的全新智能网页代理,成功率高达73.2%,较以往提升了20%。这一新技术旨在实现自主网页导航,让人工智能代理能够更高效地完成复杂在线任务,从数据检索和表单提交到订购最便宜的机票或预订住宿。

image.png

传统的网页代理在处理现代网页的复杂性和变化性时常常表现低效且容易出错。它们往往无法准确执行任务,因为无法有效处理嘈杂且庞大的 HTML 文档对象模型(DOMs)。这种低效性是实际应用中自主网页代理部署的重要障碍,而在这些场景下,可靠性和精准度至关重要。

Emergence AI 的研究团队引入了 Agent-E,这是一款旨在克服现有系统缺陷的全新网页代理。Agent-E 采用分层架构,将任务规划和执行阶段分为两个独立组件:规划代理和浏览器导航代理。这种每个组件可以专注于其特定角色,从而提高效率和性能。规划代理将用户任务拆分为较小的子任务,并通过先进的 DOM 提炼技术由浏览器导航代理执行。

image.png

Agent-E 的方法包括多项创新步骤,以有效管理嘈杂且庞大的网络内容。规划代理将用户任务拆分为较小的子任务,并将其分配给浏览器导航代理。浏览器导航代理使用灵活的 DOM 提炼技术为每个任务选择最相关的 DOM 表示形式,减少噪音并专注于特定任务信息。Agent-E 采用变化观察来监视任务执行过程中的状态变化,提供反馈以增强代理的性能和准确性。

经过 WebVoyager 基准测试评估,Agent-E 明显优于以往最先进的网页代理系统。Agent-E 取得了73.2% 的成功率,比以往纯文本网页代理提高了20%,比多模态网页代理提高了16%。在像 Wolfram Alpha 这样复杂的网站上,Agent-E 的性能提高达30%。除成功率外,研究团队还报告了其他指标,如任务完成时间和错误感知。Agent-E 平均需要150秒才能成功完成一个任务,对于失败的任务需要220秒。每个任务平均需要25次大型语言模型调用,突显其效率和有效性。

Emergence AI 进行的研究代表了自主网页导航领域的重大进展。通过采用分层架构和先进的 DOM 管理技术解决了当前网页代理系统存在的低效问题,Agent-E 为性能和可靠性设立了新标杆。该研究结果表明,这些创新可以应用于除网络自动化之外的其他人工智能驱动自动化领域,并为 agent 系统设计原则提供了宝贵见解。Agent-E 在实现73.2% 任务完成率和高效任务执行过程方面取得成功,突显了其改变网络导航和自动化潜力。

项目入口:https://top.aibase.com/tool/agent-e

### 划重点:

🌟 Emergence AI 推出 Agent-E:成功率73.2%,提升20%  

🌟 Agent-E 采用分层架构、DOM 管理技术  

🌟 在 WebVoyager 基准测试中明显优于以往