Modèles de la série Qwen2.5 open source d'Alibaba Tongyi Qianwen : Qwen2-VL-72B rivalise avec GPT-4

AIbase基地

Publié leActualités IA · 3 minutes de lecture · Sep 19, 2024

1.7k

L'équipe de Tongyi Qianwen a annoncé la sortie en open source de la nouvelle série de modèles linguistiques Qwen2.5, trois mois après la sortie de Qwen2. Il s'agit probablement de l'une des plus importantes publications en open source de l'histoire, incluant le modèle linguistique général Qwen2.5, ainsi que les modèles Qwen2.5-Coder et Qwen2.5-Math, spécifiquement conçus pour la programmation et les mathématiques.

La série de modèles Qwen2.5 a été pré-entraînée sur un ensemble de données massif contenant jusqu'à 18 T de jetons. Par rapport à Qwen2, les nouveaux modèles présentent des améliorations significatives en termes d'acquisition de connaissances, de capacités de programmation et de capacités mathématiques. Les modèles prennent en charge le traitement de longs textes, pouvant générer jusqu'à 8 000 jetons, tout en conservant la prise en charge de plus de 29 langues.

微信截图_20240919080229.png

微信截图_20240919080238.png

La publication en open source de la série de modèles Qwen2.5 utilise la licence Apache 2.0 et propose des versions de différentes tailles pour répondre aux différents besoins des applications. De plus, l'équipe Tongyi Qianwen a également publié en open source le modèle Qwen2-VL-72B, dont les performances sont comparables à celles de GPT-4.

Les nouveaux modèles présentent des améliorations significatives dans l'exécution d'instructions, la génération de longs textes, la compréhension des données structurées et la génération de sorties structurées. En particulier dans les domaines de la programmation et des mathématiques, les modèles Qwen2.5-Coder et Qwen2.5-Math, entraînés sur des ensembles de données spécialisés, affichent des capacités plus fortes dans ces domaines.

Expérience des modèles de la série Qwen2.5 :

Ensemble Qwen2.5 : https://modelscope.cn/studios/qwen/Qwen2.5

Manus, fondé par Ji Yichao : un produit basé sur le modèle linguistique géant Qianwen d'Alibaba

Manus, le produit Agent IA de la startup chinoise Monica, a récemment suscité un engouement sur la plateforme X. Son fondateur, Ji Yichao, a dévoilé aujourd'hui des détails techniques supplémentaires sur les médias sociaux. Selon Ji Yichao, Manus est développé sur la base du modèle linguistique géant Qianwen d'Alibaba, et utilise plusieurs modèles finement ajustés pour réaliser ses fonctionnalités uniques. Cette annonce a non seulement déclenché une discussion au sein de l'industrie sur l'origine technologique de Manus, mais a également ravivé l'intérêt de la communauté mondiale de l'IA pour son potentiel. Ji Yichao...

Plateforme nationale d'internet de supercalcul intégrée au grand modèle linguistique Qwen d'Alibaba : API QwQ-32B disponible

Selon les informations, la plateforme nationale d'internet de supercalcul a annoncé l'intégration du grand modèle linguistique Qwen d'Alibaba, offrant officiellement le service d'API QwQ-32B. Les utilisateurs peuvent obtenir gratuitement jusqu'à 1 million de jetons lors de l'utilisation de ce service, offrant ainsi une excellente opportunité aux développeurs et aux chercheurs. QwQ-32B est le dernier modèle d'inférence open source de l'équipe Alibaba Tongyi, affichant d'excellentes performances. Selon plusieurs données d'évaluation faisant autorité, les capacités de QwQ-32B sont comparables à celles d'un modèle 671B à pleine puissance.

Actualités IA

Modèles de la série Qwen2.5 open source d'Alibaba Tongyi Qianwen : Qwen2-VL-72B rivalise avec GPT-4

AIbase基地

Recommandations d'actualités IA connexes

Centre de calcul de Guangzhou intègre le grand modèle linguistique Tongyi Qianwen d'Alibaba QwQ-32B

Manus, fondé par Ji Yichao : un produit basé sur le modèle linguistique géant Qianwen d'Alibaba

FoxBrain : un modèle linguistique chinois de grande envergure lancé par Foxconn en seulement quatre semaines !

Plateforme nationale d'internet de supercalcul intégrée au grand modèle linguistique Qwen d'Alibaba : API QwQ-32B disponible