L'équipe technique de Zhipu AI a annoncé la publication en open source de ses modèles GLM (General Language Model) de 32B et 9B paramètres, et le lancement officiel de sa nouvelle plateforme interactive Z.ai. Cette série de modèles comprend des modèles de base, des modèles d'inférence et des modèles de réflexion, tous régis par la licence MIT permissive, offrant aux développeurs une grande liberté d'utilisation et de développement. Ils sont utilisables gratuitement à des fins commerciales et peuvent être librement distribués.

Le modèle de base GLM-4-32B-0414, publié en open source, possède 32 milliards de paramètres et a été pré-entraîné sur 15 To de données de haute qualité, incluant notamment un riche ensemble de données synthétiques liées à l'inférence. En phase de post-entraînement, grâce à des techniques comme le rejet d'échantillons et l'apprentissage par renforcement, les performances du modèle ont été considérablement améliorées pour des tâches telles que le suivi d'instructions, la génération de code, et les appels de fonctions. Certains benchmarks atteignent, voire dépassent, les niveaux de modèles plus grands tels que GPT-4o et DeepSeek-V3-0324 (671B). De plus, GLM-4-32B-0414 a amélioré ses capacités de génération de code, permettant de traiter et de générer des codes de fichiers uniques plus complexes. Le mode conversationnel de Z.ai intègre une fonction d'aperçu permettant de visualiser le HTML et le SVG générés, facilitant ainsi l'évaluation et l'optimisation des résultats.

微信截图_20250415090652.png

Le modèle d'inférence GLM-Z1-32B-0414, basé sur GLM-4-32B-0414, utilise une stratégie d'apprentissage par renforcement étendu et un démarrage à froid, et a été optimisé pour des tâches clés telles que les mathématiques, le code et la logique. Ses performances sur certaines tâches sont comparables à celles de DeepSeek-R1 (671B paramètres), démontrant de solides capacités de raisonnement mathématique et permettant de résoudre des tâches plus complexes et variées. Il est important de noter que la vitesse d'inférence mesurée de GLM-Z1-32B-0414 atteint 200 jetons/seconde, ce qui en fait le modèle commercial le plus rapide en Chine, à un prix 30 fois inférieur à celui de DeepSeek-R1.

Le modèle GLM-Z1-9B-0414 (9B paramètres) utilise les mêmes techniques, et malgré un nombre de paramètres inférieur, il offre d'excellentes performances en raisonnement mathématique et en tâches générales, se classant parmi les meilleurs modèles open source de sa taille. Il constitue un choix idéal pour les utilisateurs recherchant un déploiement léger, offrant un excellent équilibre entre efficacité et performances, particulièrement dans les environnements aux ressources limitées.

微信截图_20250415090630.png

Le modèle de réflexion GLM-Z1-Rumination-32B-0414 représente la prochaine étape de l'exploration de Zhipu AI en matière d'AGI (Intelligence Artificielle Générale). Contrairement aux modèles d'inférence classiques, le modèle de réflexion résout des problèmes complexes et ouverts en utilisant un processus de réflexion approfondie en plusieurs étapes. Son innovation clé réside dans sa capacité à intégrer des outils de recherche pour traiter des tâches complexes pendant le processus de réflexion approfondie, et à utiliser plusieurs mécanismes de récompense basés sur des règles pour guider et étendre l'apprentissage par renforcement de bout en bout. Ce modèle prend en charge un cycle de recherche complet : « poser des questions de manière autonome – rechercher des informations – construire des analyses – accomplir des tâches », améliorant ainsi considérablement ses capacités en rédaction de recherche et en tâches de recherche complexes.

En plus de la publication en open source des modèles, les modèles de base et d'inférence sont également disponibles sur la plateforme ouverte MaaS de Zhipu (bigmodel.cn), offrant des services API aux entreprises et aux développeurs. Deux versions du modèle de base sont disponibles : GLM-4-Air-250414 et GLM-4-Flash-250414, la seconde étant entièrement gratuite. Trois versions du modèle d'inférence sont proposées pour répondre aux différents besoins : GLM-Z1-AirX (version ultra-rapide), le modèle d'inférence le plus rapide de Chine avec une vitesse de 200 jetons/seconde, soit 8 fois plus rapide que les modèles classiques ; GLM-Z1-Air (version économique), 30 fois moins cher que DeepSeek-R1, idéal pour les utilisations fréquentes ; et GLM-Z1-Flash (version gratuite), permettant une utilisation gratuite pour faciliter l'accès aux modèles.

Parallèlement, Zhipu AI a lancé le nouveau domaine Z.ai. Cette plateforme intègre les modèles GLM de base, d'inférence et de réflexion 32B, servant de point d'accès interactif aux derniers modèles de Zhipu AI. Trois modèles open source sont actuellement disponibles, permettant aux utilisateurs de tester gratuitement les puissantes fonctionnalités de ces modèles.