Recientemente, un artículo de DeepMind sobre la aplicación de transformadores de escala ultralarga en el ajedrez ha generado un amplio debate en la comunidad de IA. Los investigadores utilizaron un nuevo conjunto de datos llamado ChessBench para entrenar modelos Transformer con hasta 270 millones de parámetros, explorando su capacidad en problemas de planificación complejos como el ajedrez.

El conjunto de datos ChessBench contiene 10 millones de partidas de ajedrez humanas recopiladas de la plataforma Lichess, y se ha anotado utilizando el motor de ajedrez de alto nivel Stockfish16. Proporciona hasta 15 mil millones de puntos de datos, incluyendo la probabilidad de ganar en cada estado del juego, la mejor jugada y la evaluación del valor de todas las jugadas legales.

image.png

Los investigadores utilizaron un método de aprendizaje supervisado para entrenar el modelo Transformer para predecir el valor de cada jugada legal dado un estado del juego. Los resultados experimentales muestran que, incluso sin usar ningún algoritmo de búsqueda explícito, el modelo de mayor escala puede hacer predicciones bastante precisas en nuevos estados del juego, mostrando una poderosa capacidad de generalización.

Sorprendentemente, el modelo logró una calificación Elo de 2895 en partidas rápidas contra jugadores humanos en la plataforma Lichess, alcanzando el nivel de Gran Maestro de ajedrez.

image.png

Los investigadores también compararon el modelo con motores de ajedrez basados en el aprendizaje por refuerzo y el autojuego, como Leela Chess Zero y AlphaZero. Los resultados muestran que, aunque es posible refinar una versión aproximada del algoritmo de búsqueda de Stockfish en el modelo Transformer mediante aprendizaje supervisado, todavía existen desafíos para lograr una refinación perfecta.

Esta investigación demuestra el enorme potencial de los modelos Transformer de escala ultralarga para resolver problemas de planificación complejos, y ofrece nuevas ideas para el desarrollo futuro de algoritmos de IA. La publicación del conjunto de datos ChessBench también proporcionará a los investigadores una nueva plataforma de referencia para explorar la capacidad de planificación de la IA.