Recentemente, um sistema de IA desenvolvido pelo Google DeepMind, o AlphaGeometry2, superou a média dos ganhadores de medalha de ouro na Olimpíada Internacional de Matemática (IMO) em questões de geometria. O AlphaGeometry2 é uma versão aprimorada do sistema AlphaGeometry lançado pelo DeepMind no ano passado. Em sua pesquisa mais recente, a equipe afirmou que o sistema consegue resolver 84% dos problemas de geometria da IMO dos últimos 25 anos.

Mas por que o DeepMind está focando em uma competição matemática do ensino médio? Os pesquisadores acreditam que novos métodos para resolver problemas de geometria complexa podem ser a chave para melhorar as capacidades da IA, especialmente em geometria euclidiana. Provar teoremas matemáticos requer raciocínio e a capacidade de escolher os passos corretos para a solução. O DeepMind acredita que essas habilidades de resolução de problemas podem ser cruciais para o desenvolvimento futuro de modelos de IA de uso geral.

Modelo de matemática LLM Lhama

Observação da fonte: Imagem gerada por IA, provedor de serviços de licenciamento de imagens Midjourney

Neste verão, o DeepMind também apresentou um sistema que combina o AlphaGeometry2 com o AlphaProof (um modelo de IA para raciocínio matemático formal). Este sistema resolveu quatro das seis questões da prova eliminatória da IMO de 2024. Além dos problemas de geometria, esse método pode ser estendido para outras áreas da matemática e da ciência, e até mesmo ajudar no processamento de cálculos de engenharia complexos.

O núcleo do AlphaGeometry2 inclui um modelo de linguagem da família Gemini do Google e um "motor simbólico". O modelo Gemini ajuda o motor simbólico a usar as regras matemáticas para deduzir soluções para os problemas. Seu fluxo de trabalho é o seguinte: o modelo Gemini prevê quais construções (como pontos, linhas e círculos) podem ser úteis para resolver o problema, e então o motor simbólico realiza o raciocínio lógico com base nessas construções. Após uma série de buscas complexas, o AlphaGeometry2 consegue combinar as sugestões do modelo Gemini com os princípios conhecidos para chegar à prova.

Embora o AlphaGeometry2 tenha resolvido 42 das 50 questões da IMO, superando a pontuação média dos medalhistas de ouro, ele ainda apresenta algumas limitações, como a incapacidade de resolver problemas com um número variável de pontos, equações não lineares e desigualdades. Além disso, em alguns problemas mais difíceis, o desempenho do AlphaGeometry2 não foi ideal, resolvendo apenas 20 das 29 questões.

Esta pesquisa levanta novamente a discussão sobre se os sistemas de IA devem ser baseados em operações simbólicas ou em redes neurais mais semelhantes ao cérebro. O AlphaGeometry2 utiliza um método híbrido, combinando redes neurais e um motor simbólico baseado em regras. A equipe do DeepMind destaca que, embora os grandes modelos de linguagem possam gerar soluções parciais sem ferramentas externas, o motor simbólico ainda é uma ferramenta importante em aplicações matemáticas no cenário atual.