A Universidade de Waterloo e outras instituições lançaram em código aberto o MAmmoTH, um grande modelo de linguagem projetado especificamente para problemas matemáticos. O MAmmoTH superou os modelos de código aberto existentes em conjuntos de dados de raciocínio matemático, com uma melhora média de precisão de 12% a 29%. Especificamente, o modelo MAmmoTH-7B atingiu uma precisão de 35% em conjuntos de dados de nível competitivo, superando o melhor modelo de código aberto de 7B. O modelo MAmmoTH-34B alcançou uma precisão de 46% no conjunto de dados MATH, ultrapassando até mesmo os resultados do GPT-4. A superioridade de desempenho do MAmmoTH o estabelece como o novo líder na área de raciocínio matemático.
MAmmoTH Open Source: Modelo de linguagem grande para matemática com 34B de parâmetros, superando o GPT-4, com precisão média aprimorada em 29%

新智元
Este artigo é do AIbase Daily
Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.