Recentemente, um artigo da DeepMind sobre a aplicação de Transformers de grande escala no xadrez gerou ampla discussão na comunidade de IA. Os pesquisadores utilizaram um novo conjunto de dados chamado ChessBench para treinar modelos Transformer com até 270 milhões de parâmetros, explorando sua capacidade em problemas complexos de planejamento como o xadrez.

O conjunto de dados ChessBench contém 10 milhões de jogos de xadrez humanos coletados da plataforma Lichess e anotados usando o motor de xadrez de ponta Stockfish16, fornecendo até 15 bilhões de pontos de dados, incluindo a probabilidade de vitória, a melhor jogada e a avaliação de valor de todas as jogadas legais para cada estado do jogo.

image.png

Os pesquisadores usaram métodos de aprendizado supervisionado para treinar o modelo Transformer a prever o valor de cada jogada legal dado um estado do jogo. Os resultados experimentais mostraram que, mesmo sem usar nenhum algoritmo de busca explícito, o modelo de maior escala conseguiu fazer previsões bastante precisas em novos estados do jogo, demonstrando uma forte capacidade de generalização.

Surpreendentemente, o modelo atingiu uma classificação Elo de 2895 em partidas rápidas contra jogadores humanos na plataforma Lichess, alcançando o nível de um mestre de xadrez.

image.png

Os pesquisadores também compararam o modelo com motores de xadrez baseados em aprendizado por reforço e auto-jogo, como Leela Chess Zero e AlphaZero. Os resultados mostraram que, embora seja possível destilar uma versão aproximada do algoritmo de busca do Stockfish para o modelo Transformer através do aprendizado supervisionado, ainda existem desafios para alcançar uma destilação perfeita.

Esta pesquisa demonstra o enorme potencial dos modelos Transformer de grande escala na resolução de problemas complexos de planejamento e oferece novas ideias para o desenvolvimento futuro de algoritmos de IA. A publicação do conjunto de dados ChessBench também fornecerá uma nova plataforma de referência para pesquisadores explorarem a capacidade de planejamento da IA.