L'équipe d'"Tongyi Qianwen" d'Alibaba a fait une grande annonce ! Ils viennent de sortir Qwen2Math Demo, un modèle mathématique qui est une véritable bête de somme, surpassant même GPT-4.
Ce modèle peut non seulement traiter les problèmes mathématiques saisis sous forme textuelle, mais aussi comprendre les formules contenues dans les images et les captures d'écran. Imaginez : vous prenez une photo d'une équation, et il vous donne la solution ! Un véritable outil magique pour les devoirs de mathématiques ! (Bien sûr, nous ne recommandons pas la triche.)
Qwen2-Math est disponible en trois versions : 72B, 7B et 1.5B. La version 72B est un véritable génie des mathématiques, surpassant GPT-4 de 7 points sur l'ensemble de données MATH, soit une amélioration de 9,6 %. C'est comme si vous obteniez 145 points en mathématiques au bac, tandis que votre camarade de classe n'en obtient que 132.
Plus impressionnant encore, la version 7B, avec moins d'un dixième du nombre de paramètres, surpasse le modèle mathématique open source NuminaMath de 72B. Rappelons que NuminaMath a remporté un prix lors de la première édition de l'AIMO, prix remis par le "grand maître" des mathématiques, Terence Tao.
Lin Junyang, expert en algorithmes senior chez Alibaba, a annoncé avec enthousiasme qu'ils avaient transformé le modèle Qwen2 en un expert en mathématiques. Comment ? Grâce à un "supplément cérébral" spécial : une base de données spécialement conçue pour les mathématiques. Ce "supplément" contient une grande quantité de textes mathématiques de haute qualité, de livres, de codes, d'examens, et même des problèmes de mathématiques "créés" par le modèle Qwen2 lui-même.
Le résultat ? Sur les ensembles de tests mathématiques classiques GSM8K et MATH, Qwen2-Math-72B a laissé derrière lui Llama-3.1 de 405B. Ces ensembles de tests ne sont pas anodins ; ils contiennent des problèmes de mathématiques complexes en algèbre, géométrie, probabilités et théorie des nombres.
De plus, Qwen2-Math a relevé le défi des ensembles de données chinois CMATH et des épreuves du baccalauréat. Sur les ensembles de données chinois, même la version 1.5B surpasse Llama3.1 de 70B. Et quelle que soit la version, les résultats sont nettement meilleurs que ceux du modèle Qwen2 de base de même taille.
Il semble que "Tongyi Qianwen" a vraiment trouvé un génie des mathématiques ! Pourrons-nous lui poser nos questions de mathématiques à l'avenir ? N'oubliez pas que ce n'est qu'un outil. Ne vous laissez pas aveugler par son intelligence ; il est important de continuer à travailler sur vos propres compétences en mathématiques !
Adresse de démonstration en ligne : https://huggingface.co/spaces/Qwen/Qwen2-Math-Demo