El último sistema de IA de Google DeepMind, AlphaGeometry2, ha demostrado un rendimiento excepcional en la resolución de problemas de geometría, superando incluso a los ganadores de medallas de oro promedio en las Olimpiadas Internacionales de Matemáticas (IMO). Considerado una mejora de AlphaGeometry, los investigadores afirman que AlphaGeometry2 puede resolver el 84% de los problemas de geometría de las IMO de los últimos 25 años.
¿Por qué DeepMind se centra en una competición matemática de nivel secundario? Creen que encontrar nuevas formas de resolver problemas de geometría complejos, especialmente en geometría euclidiana, podría ser clave para mejorar la capacidad de la IA. Demostrar teoremas matemáticos o explicar por qué funcionan (como el teorema de Pitágoras) requiere razonamiento lógico y la capacidad de elegir entre múltiples pasos posibles. Si la teoría de DeepMind es correcta, estas habilidades para resolver problemas serán cruciales para los futuros modelos de IA general.
Este verano, DeepMind presentó un sistema que combina AlphaGeometry2 con el modelo de razonamiento matemático AlphaProof, el cual resolvió cuatro de los seis problemas de las IMO 2024. Además de los problemas de geometría, este método se puede extender a otras áreas de las matemáticas y la ciencia, como cálculos de ingeniería complejos.
Los componentes principales de AlphaGeometry2 incluyen un modelo de lenguaje de la serie Gemini de Google y un "motor simbólico". El modelo Gemini ayuda al motor simbólico a deducir soluciones viables para los problemas utilizando reglas matemáticas. Los problemas de geometría de las IMO suelen basarse en figuras que requieren la adición de "construcciones", como puntos, líneas o círculos. El modelo Gemini de AlphaGeometry2 puede predecir qué construcciones podrían ser útiles para resolver el problema.
Cabe destacar que AlphaGeometry2 utilizó datos sintéticos de más de 300 millones de teoremas y demostraciones generados por DeepMind para entrenar en la resolución de problemas de las IMO. El equipo de investigación seleccionó 45 problemas de geometría de las IMO de los últimos 25 años y los amplió, creando un conjunto de 50 problemas. AlphaGeometry2 resolvió correctamente 42 de ellos, superando la puntuación media de los ganadores de medallas de oro.
Sin embargo, AlphaGeometry2 todavía tiene algunas limitaciones, como su incapacidad para resolver problemas con un número variable de puntos, ecuaciones no lineales y desigualdades. A pesar de ello, esta investigación ha suscitado un debate sobre si los sistemas de IA deben basarse en operaciones simbólicas o en redes neuronales. AlphaGeometry2 utiliza un método híbrido que combina redes neuronales con un motor simbólico basado en reglas.
El éxito de AlphaGeometry2 ofrece nuevas perspectivas para el futuro desarrollo de la IA general. Aunque todavía no es completamente autónomo, la investigación del equipo de DeepMind sugiere que en el futuro podrían surgir modelos de IA más autónomos.
Enlace al artículo: https://arxiv.org/pdf/2502.03544
Puntos clave:
📊 AlphaGeometry2 puede resolver el 84% de los problemas de geometría de las IMO de los últimos 25 años, superando la puntuación media de los ganadores de medallas de oro.
🔍 El sistema combina redes neuronales y un motor simbólico, utilizando un método híbrido para resolver problemas matemáticos complejos.
📈 DeepMind espera impulsar el progreso en la investigación de la IA general más potente mediante la resolución de problemas de geometría.