A Universidade de Waterloo e outras instituições lançaram em código aberto o MAmmoTH, um grande modelo de linguagem projetado especificamente para problemas matemáticos. O MAmmoTH superou os modelos de código aberto existentes em conjuntos de dados de raciocínio matemático, com uma melhora média de precisão de 12% a 29%. Especificamente, o modelo MAmmoTH-7B atingiu uma precisão de 35% em conjuntos de dados de nível competitivo, superando o melhor modelo de código aberto de 7B. O modelo MAmmoTH-34B alcançou uma precisão de 46% no conjunto de dados MATH, ultrapassando até mesmo os resultados do GPT-4. A superioridade de desempenho do MAmmoTH o estabelece como o novo líder na área de raciocínio matemático.