L'équipe de Mistral AI a de nouveau fait une annonce majeure. Récemment, ils ont publié un modèle mathématique appelé MathΣtral, un hommage au 2311e anniversaire d'Archimède, et une avancée significative dans le domaine du raisonnement mathématique et des découvertes scientifiques.

MathΣtral est un modèle de 7B conçu pour le raisonnement mathématique et les découvertes scientifiques, doté d'une fenêtre contextuelle de 32k, ce qui lui permet de traiter des problèmes mathématiques plus longs et plus complexes. Distribué sous licence Apache2.0, il offre une grande commodité aux chercheurs et aux développeurs.

image.png

L'équipe de Mistral AI a offert MathΣtral à la communauté scientifique afin de renforcer la recherche sur les problèmes mathématiques avancés nécessitant un raisonnement logique complexe et multi-étapes. Ses compétences spécialisées dans les domaines STEM lui ont permis d'atteindre des capacités de raisonnement de pointe dans diverses évaluations de référence sectorielles. Notamment, il a atteint 56,6 % au benchmark MATH et 63,47 % au benchmark MMLU.

La capacité de raisonnement de MathΣtral est particulièrement remarquable. Ce modèle démontre que des temps de calcul de raisonnement plus longs permettent d'obtenir des résultats significativement meilleurs. Dans le benchmark MATH, le score de MathΣtral 7B atteint 68,37 % par vote majoritaire, et même 74,59 % parmi 64 candidats grâce à un puissant modèle de récompense.

image.png

Cette initiative de l'équipe de Mistral AI s'inscrit dans le cadre d'un effort plus large de soutien aux projets universitaires. La publication de MathΣtral, réalisée en collaboration avec Project Numina, témoigne de l'importance et du soutien accordés par Mistral AI à la recherche académique.

MathΣtral est un modèle directif qui peut être utilisé ou affiné selon la documentation de Mistral AI. Les poids du modèle sont hébergés sur HuggingFace. Désormais, les utilisateurs peuvent essayer MathΣtral avec misstral-inference et l'adapter à leurs besoins spécifiques avec misstral-finetune.

Le modèle MathΣtral de Mistral AI représente non seulement un bond technologique, mais aussi une contribution significative à la recherche en mathématiques et en sciences. Avec le développement continu des technologies d'IA, nous avons toutes les raisons de croire que MathΣtral ouvrira de nouvelles possibilités et permettra des avancées majeures dans le domaine du raisonnement mathématique et des découvertes scientifiques.

Adresse du site web : https://mistral.ai/news/mathstral/