A equipe do "Tongyi Qianwen" da Alibaba fez um grande anúncio! Eles acabaram de lançar a demonstração do Qwen2Math, um modelo matemático que é simplesmente um monstro, superando até mesmo o GPT-4.
Este modelo não apenas resolve problemas matemáticos inseridos em texto, mas também entende fórmulas em imagens e capturas de tela. Imagine: você tira uma foto de uma equação e ele a resolve para você – uma ferramenta incrível para as aulas de matemática! (Claro, não recomendamos trapacear.)
O Qwen2-Math foi lançado em três versões: 72B, 7B e 1.5B. A versão 72B é um gênio da matemática, obtendo 7 pontos a mais que o GPT-4 no conjunto de dados MATH, representando uma melhoria de 9,6%. É como se você tirasse 145 pontos em matemática no vestibular, enquanto seu colega tirou apenas 132.
Ainda mais impressionante: a versão 7B, com menos de um décimo dos parâmetros, superou o modelo matemático de código aberto NuminaMath de 72B. Lembre-se que o NuminaMath ganhou um prêmio no primeiro AIMO global, prêmio concedido pelo "grande mestre" da matemática, Terence Tao.
O especialista sênior em algoritmos da Alibaba, Lin Junyang, anunciou entusiasmado que eles transformaram o modelo Qwen2 em um especialista em matemática. Como? Eles usaram um "suplemento cerebral matemático" especial – um corpus de dados matemáticos cuidadosamente projetado. Este "suplemento" contém uma grande quantidade de textos, livros, códigos, questões de exames de matemática de alta qualidade na internet, e até mesmo problemas matemáticos "criados" pelo próprio modelo Qwen2.
O resultado? Nos conjuntos de testes matemáticos clássicos GSM8K e MATH, o Qwen2-Math-72B superou o Llama-3.1 de 405B. Esses conjuntos de testes não são brincadeira; eles incluem problemas de álgebra, geometria, probabilidade, teoria dos números e outros desafios matemáticos.
Além disso, o Qwen2-Math também desafiou o conjunto de dados chinês CMATH e questões do vestibular. No conjunto de dados chinês, até mesmo a versão 1.5B superou o Llama3.1 de 70B. E, independentemente da versão, o desempenho foi significativamente melhor em comparação com o modelo base Qwen2 de mesmo tamanho.
Parece que o "Tongyi Qianwen" realmente criou um gênio da matemática! Podemos perguntar a ele sobre problemas de matemática no futuro? Mas lembre-se: esta é apenas uma ferramenta. Não se deixe enganar por sua inteligência; você ainda precisa praticar suas habilidades matemáticas!
Endereço para experimentar online: https://huggingface.co/spaces/Qwen/Qwen2-Math-Demo