Según los últimos informes, Emergence AI ha lanzado un nuevo agente web inteligente llamado Agent-E, con una tasa de éxito del 73,2%, un 20% más que las versiones anteriores. Esta nueva tecnología tiene como objetivo lograr una navegación web autónoma, permitiendo que los agentes de inteligencia artificial completen tareas online complejas de manera más eficiente, desde la recuperación de datos y el envío de formularios hasta la reserva de vuelos o alojamientos más baratos.

image.png

Los agentes web tradicionales suelen ser ineficientes y propensos a errores al manejar la complejidad y variabilidad de las páginas web modernas. A menudo no pueden ejecutar tareas con precisión porque no pueden procesar eficazmente los modelos de objetos de documento HTML (DOM) ruidosos y voluminosos. Esta ineficiencia es un obstáculo importante para la implementación de agentes web autónomos en aplicaciones del mundo real, donde la fiabilidad y la precisión son cruciales.

El equipo de investigación de Emergence AI ha presentado Agent-E, un nuevo agente web diseñado para superar las deficiencias de los sistemas existentes. Agent-E utiliza una arquitectura jerárquica, dividiendo las fases de planificación y ejecución de tareas en dos componentes independientes: un agente de planificación y un agente de navegación del navegador. Esta separación permite que cada componente se centre en su función específica, mejorando así la eficiencia y el rendimiento. El agente de planificación descompone las tareas del usuario en subtareas más pequeñas, que luego son ejecutadas por el agente de navegación del navegador mediante técnicas avanzadas de refinamiento del DOM.

image.png

El método de Agent-E incluye varios pasos innovadores para gestionar eficazmente el contenido web ruidoso y voluminoso. El agente de planificación descompone las tareas del usuario en subtareas más pequeñas y las asigna al agente de navegación del navegador. El agente de navegación del navegador utiliza técnicas flexibles de refinamiento del DOM para seleccionar la representación DOM más relevante para cada tarea, reduciendo el ruido y centrándose en la información específica de la tarea. Agent-E utiliza la observación de cambios para monitorear los cambios de estado durante la ejecución de la tarea, proporcionando retroalimentación para mejorar el rendimiento y la precisión del agente.

Evaluado mediante el benchmark WebVoyager, Agent-E supera significativamente a los sistemas de agentes web de vanguardia anteriores. Agent-E logró una tasa de éxito del 73,2%, un 20% más que los agentes web de texto plano anteriores y un 16% más que los agentes web multimodales. En sitios web complejos como Wolfram Alpha, el rendimiento de Agent-E mejoró hasta en un 30%. Además de la tasa de éxito, el equipo de investigación también informó sobre otras métricas, como el tiempo de finalización de la tarea y la detección de errores. Agent-E tarda un promedio de 150 segundos en completar una tarea con éxito y 220 segundos para las tareas fallidas. Cada tarea requiere un promedio de 25 llamadas a modelos de lenguaje de gran tamaño, lo que destaca su eficiencia y eficacia.

La investigación realizada por Emergence AI representa un avance significativo en el campo de la navegación web autónoma. Al abordar la ineficiencia de los sistemas de agentes web actuales mediante el uso de una arquitectura jerárquica y técnicas avanzadas de gestión del DOM, Agent-E establece un nuevo estándar para el rendimiento y la fiabilidad. Los resultados de la investigación sugieren que estas innovaciones se pueden aplicar a otros campos de automatización impulsados por la IA además de la automatización web, y ofrecen valiosas ideas para los principios de diseño de sistemas de agentes. El éxito de Agent-E en la consecución de una tasa de finalización de tareas del 73,2% y la ejecución eficiente de tareas destaca su potencial para transformar la navegación y la automatización web.

Enlace al proyecto:https://top.aibase.com/tool/agent-e

### Puntos clave:

🌟 Emergence AI lanza Agent-E: 73,2% de tasa de éxito, un 20% de mejora  

🌟 Agent-E utiliza una arquitectura jerárquica y técnicas de gestión del DOM  

🌟 Supera significativamente a los anteriores en las pruebas de referencia de WebVoyager