Recientemente, una startup llamada MultiOn lanzó un agente inteligente llamado Agent Q, que ha generado un gran interés al presumir una asombrosa tasa de éxito del 95.4% en tareas reales.
Aún más llamativo es el frecuente uso del emoji de fresa por parte del CEO de MultiOn, Div Garg, en Twitter, lo que inevitablemente evoca el misterioso proyecto Q de OpenAI.
Los usuarios de internet sienten mucha curiosidad por la tecnología detrás de Agent Q. Algunos especulan que podría estar respaldado por el proyecto Q* de OpenAI. MultiOn no solo creó una cuenta de Twitter independiente para Agent Q, sino que también la decoró con imágenes y datos básicos relacionados con las fresas, lo que sin duda aumenta la intriga sobre su tecnología subyacente.
Agent Q combina búsqueda, autorreflexión y aprendizaje por refuerzo, lo que le permite planificar y autocorregirse. Al introducir un nuevo marco de aprendizaje e inferencia, resuelve las limitaciones de las técnicas de entrenamiento LLM anteriores, permitiéndole navegar por la web de forma autónoma.
En tareas simuladas de compras online, Agent Q demostró una potente capacidad de búsqueda. En tareas reales de reserva en OpenTable, Agent Q mejoró la tasa de éxito de cero ejemplos de LLaMa-3 del 18.6% al 81.7%, un aumento del 340%, y todo ello tras solo un día de recopilación autónoma de datos.
Aunque Agent Q ha demostrado un excelente rendimiento en las pruebas de evaluación, los métodos utilizados aún requieren discusión y mejora. Por ejemplo, el diseño del algoritmo de inferencia, la selección de la estrategia de búsqueda y la seguridad e interacción online necesitan más investigación y optimización.
La aparición de Agent Q es sin duda un gran avance en el campo de los agentes inteligentes de IA, pero si se convertirá en un líder en el sector de la IA o simplemente una hábil campaña de marketing, solo el tiempo lo dirá. En cualquier caso, el lanzamiento de Agent Q ha abierto nuevas posibilidades e ideas para el desarrollo de la IA.
Referencias:
https://www.multion.ai/blog/introducing-agent-q-research-breakthrough-for-the-next-generation-of-ai-agents-with-planning-and-self-healing-capabilities