Recientemente, el equipo de Verses ha logrado un avance sorprendente con su agente inteligente Genius en el clásico juego Pong. Con solo el 10% de los datos y 2 horas de entrenamiento, superó a los jugadores humanos de élite y a otros modelos de IA. Este avance revolucionario marca un nuevo hito en la tecnología de IA y presagia el futuro desarrollo de los agentes inteligentes.
El éxito de Genius se debe a su diseño único. En comparación con los grandes modelos tradicionales, Genius tiene solo el 4% del tamaño del modelo SOTA IRIS y puede funcionar en un MacBook con chip M1 estándar. La inspiración de los investigadores proviene de un experimento de hace cuatro años, donde los científicos descubrieron que un "cerebro en un plato" cultivado podía aprender Pong en tan solo 5 minutos, lo que les llevó a reflexionar sobre la imitación del funcionamiento del cerebro humano.
Nota de la imagen: Imagen generada por IA, proveedor de servicios de licencias de imágenes Midjourney
El equipo de Verses considera que los agentes inteligentes de IA basados en grandes modelos tradicionales presentan graves deficiencias en el razonamiento lógico. Los modelos existentes dependen en gran medida de la memorización de los pasos de razonamiento de los datos de entrenamiento, careciendo de verdadera proactividad y curiosidad. Genius emplea el concepto de motor cognitivo, que no solo posee capacidades de cognición, razonamiento y toma de decisiones, sino que también dota al agente inteligente de la capacidad de aprendizaje activo.
En las pruebas comparativas con IRIS y otros modelos de IA, Genius demostró una poderosa capacidad de aprendizaje. Los investigadores entrenaron a Genius con 10,000 pasos de datos del juego en 2 horas, y los resultados mostraron un rendimiento superior al de IRIS, entrenado durante dos días. El éxito de Genius radica no solo en su rápida capacidad de aprendizaje, sino también en su comportamiento proactivo en el juego. Por ejemplo, en las partidas de Pong, Genius pudo remontar y ganar incluso cuando iba perdiendo, un fenómeno que no se observó en el entrenamiento de IRIS.
Sin embargo, los investigadores advierten que, aunque el rendimiento de Genius es alentador, todavía no existe un estándar unificado para medir exhaustivamente el rendimiento de la IAG (Inteligencia Artificial General). Se necesitan pruebas más diversas para verificar su adaptabilidad y fiabilidad en diferentes campos.
Este resultado de investigación no solo impulsa el desarrollo de agentes inteligentes de IA, sino que también proporciona nuevas ideas y métodos para la exploración futura de la inteligencia artificial.
Enlace del artículo: https://arxiv.org/pdf/2410.05229