A equipe da Mistral AI lançou mais uma grande novidade. Recentemente, eles divulgaram um modelo matemático chamado MathΣtral, uma homenagem ao 2311º aniversário de Arquimedes e um grande avanço na área de raciocínio matemático e descobertas científicas.
MathΣtral é um modelo de 7B projetado para raciocínio matemático e descobertas científicas, com uma janela de contexto de 32k, o que significa que ele pode lidar com problemas matemáticos mais longos e complexos. Disponibilizado sob a licença Apache2.0, oferece grande conveniência para a comunidade acadêmica e desenvolvedores.
A equipe da Mistral AI contribuiu com o MathΣtral para a comunidade científica, com o objetivo de fortalecer a pesquisa em problemas matemáticos avançados que exigem raciocínio lógico complexo e multi-etapas. A especialização do modelo em STEM demonstra capacidades de raciocínio de ponta em vários benchmarks de referência do setor. Especificamente, atingiu 56,6% no benchmark MATH e 63,47% no benchmark MMLU.
O aspecto mais notável do MathΣtral é sua capacidade de raciocínio. O modelo demonstrou que, com mais tempo de cálculo para o raciocínio, é possível obter resultados significativamente melhores. No benchmark MATH, usando votação majoritária, o MathΣtral 7B atingiu uma pontuação de 68,37%, enquanto com um poderoso modelo de recompensa, atingiu 74,59% entre 64 candidatos.
Essa iniciativa da equipe da Mistral AI faz parte de um esforço maior da empresa para apoiar projetos acadêmicos. O lançamento do MathΣtral, em colaboração com o Project Numina, demonstra o compromisso e o apoio da Mistral AI à pesquisa acadêmica.
MathΣtral é um modelo diretivo que pode ser usado ou ajustado de acordo com a documentação da Mistral AI. Os pesos do modelo estão hospedados no HuggingFace. Agora, os usuários podem experimentar o MathΣtral usando misstral-inference e ajustá-lo usando misstral-finetune para atender a necessidades específicas.
O modelo MathΣtral da Mistral AI não é apenas um salto tecnológico, mas também uma contribuição significativa para a pesquisa em matemática e ciências. Com o desenvolvimento contínuo da tecnologia de IA, podemos acreditar que o MathΣtral trará mais possibilidades e avanços para o raciocínio matemático e as descobertas científicas.
Endereço do site: https://mistral.ai/news/mathstral/