En los últimos años, los grandes modelos de lenguaje, como ChatGPT, han generado una nueva ola en el campo de la IA. Estos potentes modelos de lenguaje no solo comprenden las instrucciones humanas, sino que también pueden planificar, explorar entornos y utilizar herramientas para resolver tareas complejas, mostrando un enorme potencial en áreas como la robótica, los asistentes personales y la automatización de procesos.
Sin embargo, la mayoría de los sistemas de agentes de IA existentes son pasivos y necesitan instrucciones humanas explícitas para ejecutar tareas. Organizar una reunión requiere la entrada manual de la hora, la ubicación e incluso la lista de asistentes, ¡lo que resulta más complicado que hacerlo uno mismo!
Imagine que recibe un correo electrónico de un compañero de trabajo sugiriendo una reunión. Un agente de IA pasivo esperaría instrucciones explícitas para programarla. Un agente de IA proactivo, en cambio, detectaría el correo electrónico y ofrecería programar la reunión. Esta proactividad no solo reduce la carga cognitiva del usuario, sino que también identifica necesidades implícitas no expresadas explícitamente por el usuario.
Para abordar la pasividad de los asistentes de IA, la Universidad Tsinghua y Mobi Intelligence se han unido para desarrollar un nuevo tipo de agente de IA. Este agente ya no es una máquina que simplemente "obedece órdenes", sino que puede "predecir el futuro" y anticiparse a sus necesidades antes de que usted las exprese.
¿Cómo lo hace este agente de IA "mágico"? ¡El secreto reside en el conjunto de datos ProactiveBench! Este conjunto de datos es como una "enciclopedia" que registra diversas actividades humanas, incluyendo cada letra que escribe en su ordenador, cada enlace en el que hace clic e incluso el contenido que copia y pega.
Utilizando este conjunto de datos, los investigadores entrenaron un modelo de recompensa, que funciona como una supercomputadora que "simula el cerebro humano" y puede juzgar si el comportamiento del agente de IA se ajusta a las expectativas humanas. Si el agente de IA se desempeña bien, recibe una recompensa; de lo contrario, se le resta puntuación. Después de un entrenamiento repetido, el agente de IA puede predecir sus necesidades basándose en su comportamiento, al igual que un humano, y ofrecer ayuda cuando la necesite.
Por ejemplo, cuando recibe un correo electrónico de un compañero de trabajo sugiriendo una reunión, este agente de IA "precognitivo" identifica automáticamente el contenido del correo electrónico y le pregunta si desea programar la reunión. Si acepta, programará automáticamente la hora, la ubicación e incluso enviará las invitaciones a la reunión. ¡Es mucho más "inteligente" que los asistentes de IA actuales!
Los resultados experimentales muestran que el agente de IA entrenado con el conjunto de datos ProactiveBench presenta un rendimiento excepcional. Por ejemplo, el modelo Qwen2-7B-Instruct obtuvo una puntuación F1 del 66,47% en la prestación proactiva de ayuda, superando a todos los modelos de código abierto y cerrados.
Aunque este agente de IA "precognitivo" aún se encuentra en fase de investigación, ofrece nuevas esperanzas para el futuro de la colaboración entre humanos y máquinas. Creemos que en un futuro próximo tendremos un asistente de IA que realmente nos "comprenda", que no solo "obedezca órdenes", sino que también nos ayude proactivamente a resolver problemas, haciendo nuestra vida más fácil y cómoda.
Enlace al artículo: https://arxiv.org/pdf/2410.12361