Démonstration de Qwen2 Math, le modèle mathématique de Tongyi Qianwen, disponible : la version 72B surpasse GPT-4

AIbase基地

Publié leActualités IA · 5 minutes de lecture · Aug 20, 2024

545

L'équipe d'"Tongyi Qianwen" d'Alibaba a fait une grande annonce ! Ils viennent de sortir Qwen2Math Demo, un modèle mathématique qui est une véritable bête de somme, surpassant même GPT-4.

Ce modèle peut non seulement traiter les problèmes mathématiques saisis sous forme textuelle, mais aussi comprendre les formules contenues dans les images et les captures d'écran. Imaginez : vous prenez une photo d'une équation, et il vous donne la solution ! Un véritable outil magique pour les devoirs de mathématiques ! (Bien sûr, nous ne recommandons pas la triche.)

Qwen2-Math est disponible en trois versions : 72B, 7B et 1.5B. La version 72B est un véritable génie des mathématiques, surpassant GPT-4 de 7 points sur l'ensemble de données MATH, soit une amélioration de 9,6 %. C'est comme si vous obteniez 145 points en mathématiques au bac, tandis que votre camarade de classe n'en obtient que 132.

Plus impressionnant encore, la version 7B, avec moins d'un dixième du nombre de paramètres, surpasse le modèle mathématique open source NuminaMath de 72B. Rappelons que NuminaMath a remporté un prix lors de la première édition de l'AIMO, prix remis par le "grand maître" des mathématiques, Terence Tao.

Lin Junyang, expert en algorithmes senior chez Alibaba, a annoncé avec enthousiasme qu'ils avaient transformé le modèle Qwen2 en un expert en mathématiques. Comment ? Grâce à un "supplément cérébral" spécial : une base de données spécialement conçue pour les mathématiques. Ce "supplément" contient une grande quantité de textes mathématiques de haute qualité, de livres, de codes, d'examens, et même des problèmes de mathématiques "créés" par le modèle Qwen2 lui-même.

Le résultat ? Sur les ensembles de tests mathématiques classiques GSM8K et MATH, Qwen2-Math-72B a laissé derrière lui Llama-3.1 de 405B. Ces ensembles de tests ne sont pas anodins ; ils contiennent des problèmes de mathématiques complexes en algèbre, géométrie, probabilités et théorie des nombres.

De plus, Qwen2-Math a relevé le défi des ensembles de données chinois CMATH et des épreuves du baccalauréat. Sur les ensembles de données chinois, même la version 1.5B surpasse Llama3.1 de 70B. Et quelle que soit la version, les résultats sont nettement meilleurs que ceux du modèle Qwen2 de base de même taille.

Il semble que "Tongyi Qianwen" a vraiment trouvé un génie des mathématiques ! Pourrons-nous lui poser nos questions de mathématiques à l'avenir ? N'oubliez pas que ce n'est qu'un outil. Ne vous laissez pas aveugler par son intelligence ; il est important de continuer à travailler sur vos propres compétences en mathématiques !

Adresse de démonstration en ligne : https://huggingface.co/spaces/Qwen/Qwen2-Math-Demo

OpenAI lance GPT-4O-Audio-Preview : la voix peut désormais "comprendre" les émotions !

OpenAI révolutionne une fois de plus le secteur de l'intelligence artificielle avec le lancement de son nouveau modèle gpt-4o-audio-preview. Ce modèle fait preuve de capacités étonnantes en matière de génération et d'analyse vocale, ouvrant de nouvelles perspectives pour l'interaction homme-machine. Découvrons ensemble les caractéristiques et les applications potentielles de ce modèle innovant. Les fonctionnalités principales de gpt-4o-audio-preview se répartissent en trois axes : premièrement, il est capable de générer des réponses vocales naturelles et fluides à partir de texte, ce qui est idéal pour les assistants vocaux et les services clients virtuels.

Nouveau modèle OpenAI gpt-4o-2024-08-06 et gpt-4o-mini prennent en charge la sortie structurée

OpenAI a ajouté une fonctionnalité de sortie structurée à son API, garantissant que la sortie générée est parfaitement conforme à la structure JSON prédéfinie, améliorant ainsi considérablement la fiabilité de l'API et la précision des applications. Cette fonctionnalité définit non seulement la structure du JSON, mais garantit également l'exactitude de la sortie. Simultanément, les prix ont été réduits : le coût d'entrée a été diminué de moitié et le coût de sortie de 1/3. L'introduction de la sortie structurée a résolu les limitations du schéma JSON en matière de garantie de conformité de la sortie à une structure spécifique, améliorant considérablement les performances du modèle en matière de sortie structurée. Grâce à des innovations techniques, telles que la limitation...

OpenAI lance le nouveau modèle gpt-4o-64k-output-alpha : l'API GPT-4o prend désormais en charge des sorties jusqu'à 64K

Le point fort du nouveau modèle gpt-4o-64k-output-alpha d'OpenAI est sa capacité à générer des sorties jusqu'à 64K tokens en une seule fois. Idéal pour créer du contenu riche et détaillé, il répond aux besoins de la rédaction, de la programmation et de l'analyse de données complexes. Cependant, cette fonctionnalité augmente le prix de l'API : 18 $ par million de tokens en sortie, contre 6 $ par million de tokens en entrée. Cette mesure vise à compenser les coûts de calcul élevés et à encourager une utilisation responsable de cet outil puissant. Ce modèle est une avancée majeure pour les domaines de la création et de la recherche.

Actualités IA

Démonstration de Qwen2 Math, le modèle mathématique de Tongyi Qianwen, disponible : la version 72B surpasse GPT-4

AIbase基地

Recommandations d'actualités IA connexes

OpenAI lance GPT-4O-Audio-Preview : la voix peut désormais "comprendre" les émotions !

Nouveau modèle OpenAI gpt-4o-2024-08-06 et gpt-4o-mini prennent en charge la sortie structurée

OpenAI lance le nouveau modèle gpt-4o-64k-output-alpha : l'API GPT-4o prend désormais en charge des sorties jusqu'à 64K