El equipo de Mistral AI ha vuelto a sorprendernos con una gran noticia. Recientemente, lanzaron un modelo matemático llamado MathΣtral, un homenaje al 2311 aniversario de Arquímedes y un gran avance en el campo del razonamiento matemático y el descubrimiento científico.
MathΣtral es un modelo de 7B diseñado específicamente para el razonamiento matemático y el descubrimiento científico, con una ventana de contexto de 32k, lo que le permite manejar problemas matemáticos más largos y complejos. Con licencia Apache2.0 de código abierto, ofrece una gran comodidad para la comunidad académica y los desarrolladores.
El equipo de Mistral AI ha contribuido con MathΣtral a la comunidad científica con el objetivo de fortalecer la investigación en problemas matemáticos avanzados que requieren un razonamiento lógico complejo y multi-etapa. Su especialización en el campo STEM ha demostrado capacidades de razonamiento de vanguardia en diversas pruebas de referencia de la industria. En particular, alcanzó un 56.6% en el benchmark MATH y un 63.47% en el benchmark MMLU.
Lo más destacable de MathΣtral es su capacidad de razonamiento. Este modelo demuestra que, con más tiempo de cálculo para el razonamiento, se pueden lograr resultados significativamente mejores. En la prueba de referencia MATH, mediante votación mayoritaria, MathΣtral 7B obtuvo una puntuación del 68.37%, mientras que con un potente modelo de recompensa entre 64 candidatos, llegó a una puntuación del 74.59%.
Esta iniciativa de Mistral AI forma parte de un esfuerzo más amplio de la empresa para apoyar proyectos académicos. El lanzamiento de MathΣtral se produce en el contexto de la colaboración con Project Numina, reflejando la importancia y el apoyo que Mistral AI otorga a la investigación académica.
MathΣtral es un modelo directivo que se puede utilizar o ajustar finamente según la documentación de Mistral AI. Los pesos del modelo se alojan en HuggingFace. Ahora, los usuarios pueden probar MathΣtral con misstral-inference y adaptarlo a sus necesidades específicas con misstral-finetune.
El modelo MathΣtral de Mistral AI no solo representa un salto tecnológico, sino también una contribución significativa a la investigación en matemáticas y ciencias. Con el continuo desarrollo de la tecnología de IA, es razonable esperar que MathΣtral aporte más posibilidades y avances al razonamiento matemático y al descubrimiento científico.
Dirección del sitio web: https://mistral.ai/news/mathstral/