Plus puissant que GPT-4 : un modèle à 2 milliards de paramètres résout des problèmes d'arithmétique avec une précision de presque 100 %

学术头条

Publié leActualités IA · 2 minutes de lecture · Sep 19, 2023

Selon un article publié par Academic Headlines, des chercheurs de l'Université Tsinghua, de TAL AI Lab et de Zhipu AI ont présenté MathGLM, un modèle linguistique de 2 milliards de paramètres, conçu pour explorer l'efficacité des grands modèles linguistiques en matière de raisonnement mathématique. Ce modèle utilise une architecture de décodeur Transformer et a été entraîné sur un ensemble de données arithmétiques à grande échelle, ce qui a considérablement amélioré ses capacités de calcul mathématique. Les résultats expérimentaux montrent que MathGLM atteint une précision proche de 100 % sur une série de tâches de calcul arithmétique, surpassant nettement GPT-4. Même avec seulement 100 millions de paramètres, MathGLM surpasse GPT-4 et ChatGPT. L'étude a également révélé que les capacités de calcul arithmétique de MathGLM augmentent avec le nombre de paramètres. MathGLM surpasse également GPT-4 et ChatGPT dans le traitement des opérations arithmétiques mixtes avec des formats numériques complexes. Cette recherche montre que, avec un nombre suffisant de paramètres et de données, les modèles linguistiques peuvent effectuer des calculs mathématiques complexes avec précision.

Le grand modèle linguistique médical d'Ant Group remporte deux championnats au MedBench, ouvrant une nouvelle ère pour l'IA médicale

Récemment, MedBench, une plateforme d'évaluation de grands modèles linguistiques médicaux de renom en Chine, a publié son dernier classement. Le grand modèle linguistique médical développé par l'équipe médicale d'Ant Group a remporté la première place du classement d'évaluation et du classement d'auto-évaluation, obtenant des scores impressionnants de 97,5 et 98,2 respectivement, suscitant un vif intérêt de l'industrie. Le succès du grand modèle linguistique médical d'Ant Group est le fruit des efforts continus de son équipe dans le développement de modèles d'inférence médicale. L'équipe a récemment adopté la technologie de l'apprentissage par renforcement pour créer une nouvelle génération de modèles d'inférence médicale. Cette innovation permet au modèle de...

Silicon-Based Flow Termine un Nouveau Tour de Financement ; Meituan Investit, Zhishu se Retire

L'application Tianyancha indique que la société Beijing Silicon-Based Flow Technology Co., Ltd. a récemment subi d'importants changements commerciaux. Lors de ces changements, Beijing Zhishu Huazhang Technology Co., Ltd. a quitté le rang des actionnaires, tandis que quatre nouveaux investisseurs ont été ajoutés : Tianjin SanKuai Technology Co., Ltd. (filiale de Meituan), Beijing Xinglian Dingsen Equity Investment Fund Partnership (société en commandite), Nanjing LvYong JinHang Equity Investment Management Partnership (société en commandite), et le fonds de capital-risque PuHua (Hangzhou) pour les PME. Après ce tour de financement, le capital social enregistré de Silicon-Based Flow est passé d'environ 13 758 000 yuans...

Manus, fondé par Ji Yichao : un produit basé sur le modèle linguistique géant Qianwen d'Alibaba

Manus, le produit Agent IA de la startup chinoise Monica, a récemment suscité un engouement sur la plateforme X. Son fondateur, Ji Yichao, a dévoilé aujourd'hui des détails techniques supplémentaires sur les médias sociaux. Selon Ji Yichao, Manus est développé sur la base du modèle linguistique géant Qianwen d'Alibaba, et utilise plusieurs modèles finement ajustés pour réaliser ses fonctionnalités uniques. Cette annonce a non seulement déclenché une discussion au sein de l'industrie sur l'origine technologique de Manus, mais a également ravivé l'intérêt de la communauté mondiale de l'IA pour son potentiel. Ji Yichao...

Actualités IA

Plus puissant que GPT-4 : un modèle à 2 milliards de paramètres résout des problèmes d'arithmétique avec une précision de presque 100 %

学术头条

Recommandations d'actualités IA connexes

Le grand modèle linguistique médical d'Ant Group remporte deux championnats au MedBench, ouvrant une nouvelle ère pour l'IA médicale

Silicon-Based Flow Termine un Nouveau Tour de Financement ; Meituan Investit, Zhishu se Retire

Centre de calcul de Guangzhou intègre le grand modèle linguistique Tongyi Qianwen d'Alibaba QwQ-32B

Manus, fondé par Ji Yichao : un produit basé sur le modèle linguistique géant Qianwen d'Alibaba