¡Tasa de éxito del 95.4%! Aparece Agent Q, ¿una nueva estrella de la IA o un maestro del marketing 'fresa'?

Recientemente, una startup llamada MultiOn lanzó un agente inteligente llamado Agent Q, que ha generado un gran interés al presumir una asombrosa tasa de éxito del 95.4% en tareas reales.

Aún más llamativo es el frecuente uso del emoji de fresa por parte del CEO de MultiOn, Div Garg, en Twitter, lo que inevitablemente evoca el misterioso proyecto Q de OpenAI.

Los usuarios de internet sienten mucha curiosidad por la tecnología detrás de Agent Q. Algunos especulan que podría estar respaldado por el proyecto Q* de OpenAI. MultiOn no solo creó una cuenta de Twitter independiente para Agent Q, sino que también la decoró con imágenes y datos básicos relacionados con las fresas, lo que sin duda aumenta la intriga sobre su tecnología subyacente.

Agent Q combina búsqueda, autorreflexión y aprendizaje por refuerzo, lo que le permite planificar y autocorregirse. Al introducir un nuevo marco de aprendizaje e inferencia, resuelve las limitaciones de las técnicas de entrenamiento LLM anteriores, permitiéndole navegar por la web de forma autónoma.

En tareas simuladas de compras online, Agent Q demostró una potente capacidad de búsqueda. En tareas reales de reserva en OpenTable, Agent Q mejoró la tasa de éxito de cero ejemplos de LLaMa-3 del 18.6% al 81.7%, un aumento del 340%, y todo ello tras solo un día de recopilación autónoma de datos.

Aunque Agent Q ha demostrado un excelente rendimiento en las pruebas de evaluación, los métodos utilizados aún requieren discusión y mejora. Por ejemplo, el diseño del algoritmo de inferencia, la selección de la estrategia de búsqueda y la seguridad e interacción online necesitan más investigación y optimización.

La aparición de Agent Q es sin duda un gran avance en el campo de los agentes inteligentes de IA, pero si se convertirá en un líder en el sector de la IA o simplemente una hábil campaña de marketing, solo el tiempo lo dirá. En cualquier caso, el lanzamiento de Agent Q ha abierto nuevas posibilidades e ideas para el desarrollo de la IA.

Referencias:

https://www.multion.ai/blog/introducing-agent-q-research-breakthrough-for-the-next-generation-of-ai-agents-with-planning-and-self-healing-capabilities

Noticias de IA

¡Tasa de éxito del 95.4%! Aparece Agent Q, ¿una nueva estrella de la IA o un maestro del marketing 'fresa'?

AIbase基地