O mais recente sistema de IA da DeepMind do Google, o AlphaGeometry2, demonstrou excelente desempenho na resolução de problemas de geometria, superando a pontuação média dos ganhadores de medalha de ouro na Olimpíada Internacional de Matemática (IMO). Considerado uma versão aprimorada do AlphaGeometry, os pesquisadores afirmam que o AlphaGeometry2 consegue resolver 84% dos problemas de geometria da IMO dos últimos 25 anos.
Por que a DeepMind se concentra em uma competição de matemática do ensino médio? Eles acreditam que encontrar novas maneiras de resolver problemas complexos de geometria, especialmente na geometria euclidiana, pode ser a chave para melhorar a capacidade da IA. Provar teoremas matemáticos ou explicar por que um teorema (como o teorema de Pitágoras) é verdadeiro requer raciocínio lógico e a capacidade de selecionar entre vários passos possíveis. Se a teoria da DeepMind estiver correta, essas habilidades de resolução de problemas serão muito importantes para os futuros modelos de IA de uso geral.
Neste verão, a DeepMind apresentou um sistema que combina o AlphaGeometry2 com o modelo de IA de raciocínio matemático AlphaProof, que resolveu quatro dos seis problemas da IMO de 2024. Além dos problemas de geometria, esse método pode ser expandido para outras áreas da matemática e da ciência, como cálculos de engenharia complexos.
Os componentes principais do AlphaGeometry2 incluem um modelo de linguagem da série Gemini do Google e um "motor simbólico". O modelo Gemini ajuda o motor simbólico a derivar soluções viáveis para o problema usando regras matemáticas. Os problemas de geometria da IMO geralmente são baseados em figuras que exigem a adição de "construções", como pontos, linhas ou círculos. O modelo Gemini do AlphaGeometry2 consegue prever quais construções podem ser úteis para resolver o problema.
Vale ressaltar que o AlphaGeometry2 usou dados sintéticos de treinamento com mais de 300 milhões de teoremas e provas gerados pela própria DeepMind para resolver os problemas da IMO. A equipe de pesquisa selecionou 45 problemas de geometria da IMO dos últimos 25 anos e os expandiu, formando um conjunto de 50 problemas. O AlphaGeometry2 resolveu com sucesso 42 deles, superando a pontuação média dos ganhadores de medalha de ouro.
No entanto, o AlphaGeometry2 ainda apresenta algumas limitações, como a incapacidade de resolver problemas com um número variável de pontos, equações não lineares e desigualdades. Apesar disso, esta pesquisa gerou debates sobre se os sistemas de IA devem ser baseados em operações simbólicas ou em redes neurais. O AlphaGeometry2 utiliza um método híbrido, combinando redes neurais e um motor simbólico baseado em regras.
O sucesso do AlphaGeometry2 oferece novas direções para o futuro desenvolvimento da IA de uso geral. Embora ainda não seja totalmente autônomo, a pesquisa da equipe da DeepMind sugere que modelos de IA mais autônomos podem surgir no futuro.
Link para o artigo: https://arxiv.org/pdf/2502.03544
Destaques:
📊 O AlphaGeometry2 consegue resolver 84% dos problemas de geometria da IMO dos últimos 25 anos, superando a pontuação média dos ganhadores de medalha de ouro.
🔍 O sistema combina redes neurais e um motor simbólico, usando um método híbrido para resolver problemas matemáticos complexos.
📈 A DeepMind espera impulsionar o progresso da pesquisa em IA de uso geral mais poderosa por meio da resolução de problemas de geometria.