Recientemente, equipos de investigación de la Universidad Tsinghua, la Universidad Fudan y la Universidad de Stanford lanzaron conjuntamente un framework de desarrollo de agentes llamado "Eko", diseñado para ayudar a los desarrolladores a construir rápidamente "empleados virtuales" listos para producción utilizando código simple y lenguaje natural.
El framework Eko puede controlar el ordenador y el navegador del usuario, realizando diversas tareas tediosas en lugar de los humanos. Con Eko, los usuarios pueden automatizar funciones como la recopilación de datos, las pruebas y la gestión de archivos. Por ejemplo, los usuarios pueden configurar Eko para que recopile automáticamente los datos de acciones más recientes de Yahoo Finance y genere informes visuales. Además, Eko puede realizar pruebas automatizadas en páginas de inicio de sesión para asegurar la seguridad y estabilidad del sistema. Todo esto significa que Eko puede mejorar significativamente la eficiencia del trabajo y reducir la carga de trabajo humana.
Las innovaciones tecnológicas centrales del framework Eko se centran en tres aspectos. Primero, la "representación de agente híbrida", que integra a la perfección el lenguaje natural y el lenguaje de programación, facilitando a los desarrolladores la expresión de intenciones de diseño de alto nivel. Segundo, el "framework de agente multiplataforma", que admite diferentes entornos operativos a través de una arquitectura de percepción ambiental, garantizando que Eko pueda utilizarse de forma flexible en navegadores y ordenadores. Tercero, el "mecanismo de intervención de producción", que permite a los humanos monitorizar e intervenir en tiempo real en el flujo de trabajo del agente, garantizando la precisión y seguridad de las tareas.
La arquitectura de percepción ambiental de Eko se divide en tres niveles: núcleo general, herramientas específicas del entorno y puente de entorno. El núcleo general proporciona funciones básicas, mientras que las herramientas específicas del entorno optimizan las operaciones según el entorno. El puente de entorno se encarga de la gestión de recursos y el control de seguridad entre diferentes plataformas, asegurando una interacción eficiente.
Además, Eko introduce una novedosa solución de "percepción conjunta de elementos visuales e interactivos", mejorando significativamente la precisión y eficiencia de las tareas en páginas web complejas. Este framework combina el reconocimiento visual con la información contextual de los elementos, optimizando el rendimiento de las operaciones automatizadas.
Enlace al proyecto:https://eko.fellou.ai/
Puntos clave:
🌟 El framework Eko puede controlar el ordenador y el navegador del usuario, realizando tareas tediosas en lugar de los humanos.
🔧 La combinación de lenguaje natural y lenguaje de programación simplifica el proceso de desarrollo.
🛡️ Permite la monitorización e intervención en tiempo real por parte de humanos, garantizando la seguridad y precisión del trabajo automatizado.