智谱AI采用新域名Z.ai 并开源32B/9B系列GLM模型

AIbase基地

Publié leActualités IA · 8 minutes de lecture · Apr 15, 2025

L'équipe technique de Zhipu AI a annoncé la publication en open source de ses modèles GLM (General Language Model) de 32B et 9B paramètres, et le lancement officiel de sa nouvelle plateforme interactive Z.ai. Cette série de modèles comprend des modèles de base, des modèles d'inférence et des modèles de réflexion, tous régis par la licence MIT permissive, offrant aux développeurs une grande liberté d'utilisation et de développement. Ils sont utilisables gratuitement à des fins commerciales et peuvent être librement distribués.

Le modèle de base GLM-4-32B-0414, publié en open source, possède 32 milliards de paramètres et a été pré-entraîné sur 15 To de données de haute qualité, incluant notamment un riche ensemble de données synthétiques liées à l'inférence. En phase de post-entraînement, grâce à des techniques comme le rejet d'échantillons et l'apprentissage par renforcement, les performances du modèle ont été considérablement améliorées pour des tâches telles que le suivi d'instructions, la génération de code, et les appels de fonctions. Certains benchmarks atteignent, voire dépassent, les niveaux de modèles plus grands tels que GPT-4o et DeepSeek-V3-0324 (671B). De plus, GLM-4-32B-0414 a amélioré ses capacités de génération de code, permettant de traiter et de générer des codes de fichiers uniques plus complexes. Le mode conversationnel de Z.ai intègre une fonction d'aperçu permettant de visualiser le HTML et le SVG générés, facilitant ainsi l'évaluation et l'optimisation des résultats.

微信截图_20250415090652.png

Le modèle d'inférence GLM-Z1-32B-0414, basé sur GLM-4-32B-0414, utilise une stratégie d'apprentissage par renforcement étendu et un démarrage à froid, et a été optimisé pour des tâches clés telles que les mathématiques, le code et la logique. Ses performances sur certaines tâches sont comparables à celles de DeepSeek-R1 (671B paramètres), démontrant de solides capacités de raisonnement mathématique et permettant de résoudre des tâches plus complexes et variées. Il est important de noter que la vitesse d'inférence mesurée de GLM-Z1-32B-0414 atteint 200 jetons/seconde, ce qui en fait le modèle commercial le plus rapide en Chine, à un prix 30 fois inférieur à celui de DeepSeek-R1.

Le modèle GLM-Z1-9B-0414 (9B paramètres) utilise les mêmes techniques, et malgré un nombre de paramètres inférieur, il offre d'excellentes performances en raisonnement mathématique et en tâches générales, se classant parmi les meilleurs modèles open source de sa taille. Il constitue un choix idéal pour les utilisateurs recherchant un déploiement léger, offrant un excellent équilibre entre efficacité et performances, particulièrement dans les environnements aux ressources limitées.

微信截图_20250415090630.png

Le modèle de réflexion GLM-Z1-Rumination-32B-0414 représente la prochaine étape de l'exploration de Zhipu AI en matière d'AGI (Intelligence Artificielle Générale). Contrairement aux modèles d'inférence classiques, le modèle de réflexion résout des problèmes complexes et ouverts en utilisant un processus de réflexion approfondie en plusieurs étapes. Son innovation clé réside dans sa capacité à intégrer des outils de recherche pour traiter des tâches complexes pendant le processus de réflexion approfondie, et à utiliser plusieurs mécanismes de récompense basés sur des règles pour guider et étendre l'apprentissage par renforcement de bout en bout. Ce modèle prend en charge un cycle de recherche complet : « poser des questions de manière autonome – rechercher des informations – construire des analyses – accomplir des tâches », améliorant ainsi considérablement ses capacités en rédaction de recherche et en tâches de recherche complexes.

En plus de la publication en open source des modèles, les modèles de base et d'inférence sont également disponibles sur la plateforme ouverte MaaS de Zhipu (bigmodel.cn), offrant des services API aux entreprises et aux développeurs. Deux versions du modèle de base sont disponibles : GLM-4-Air-250414 et GLM-4-Flash-250414, la seconde étant entièrement gratuite. Trois versions du modèle d'inférence sont proposées pour répondre aux différents besoins : GLM-Z1-AirX (version ultra-rapide), le modèle d'inférence le plus rapide de Chine avec une vitesse de 200 jetons/seconde, soit 8 fois plus rapide que les modèles classiques ; GLM-Z1-Air (version économique), 30 fois moins cher que DeepSeek-R1, idéal pour les utilisations fréquentes ; et GLM-Z1-Flash (version gratuite), permettant une utilisation gratuite pour faciliter l'accès aux modèles.

Parallèlement, Zhipu AI a lancé le nouveau domaine Z.ai. Cette plateforme intègre les modèles GLM de base, d'inférence et de réflexion 32B, servant de point d'accès interactif aux derniers modèles de Zhipu AI. Trois modèles open source sont actuellement disponibles, permettant aux utilisateurs de tester gratuitement les puissantes fonctionnalités de ces modèles.

GLM-4-32B-0414 Z.ai grand modèle linguistique modèle open source

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

Hugging Face acquiert Pollen Robotics et ouvre une nouvelle ère pour la robotique

Le 15 avril, Hugging Face, la plateforme de modèles open source renommée, a annoncé l'acquisition de Pollen Robotics, marquant son entrée officielle dans le domaine de la robotique physique. Bien que les termes exacts de l'accord n'aient pas encore été divulgués, cette acquisition intégrera les quelque 20 employés de Pollen Robotics à Hugging Face. Il s'agit de la plus importante acquisition de personnel jamais réalisée par la société, témoignant de son ambition d'expansion dans de nouveaux secteurs d'activité. Le co-fondateur de Hugging Face...

Apr 16, 2025

Lancement de MiniMax, un grand modèle linguistique d'IA chinois, sur la plateforme Internet du supercalculateur national pour promouvoir l'écosystème open source de l'IA et le développement de nouvelles interactions intelligentes

L'industrie chinoise de l'intelligence artificielle accélère son entrée sur la scène mondiale. AIbase a appris des médias sociaux que la plateforme Internet du supercalculateur national a officiellement lancé les grands modèles linguistiques d'IA chinois de MiniMax, y compris MiniMax-Text-01 et MiniMax-VL-01, et qu'ils ont rejoint la communauté open source d'IA du supercalculateur Internet. Simultanément, le service de dialogue ChatBot de MiniMax a également été intégré à la plateforme, offrant aux utilisateurs une expérience d'interaction intelligente efficace. Voici une analyse approfondie de cette avancée majeure par AIbase.

Apr 16, 2025

智谱AI正式启动IPO辅导，力争成为A股首家大模型公司

Récemment, Beijing Zhishu Huazhang Technology Co., Ltd. (appelée ci-après « 智谱 AI ») a déposé auprès du Bureau de réglementation des valeurs mobilières de Beijing une demande d'enregistrement de la première émission publique d'actions (IPO), devenant ainsi la première entreprise du « Top 6 des grands modèles » à lancer une IPO. Si tout se déroule comme prévu, 智谱 AI devrait devenir la première société cotée en bourse de Chine spécialisée dans les grands modèles linguistiques. Fondée en 2019, 智谱 AI est issue de la transformation des résultats techniques du département d'informatique de l'université Tsinghua. Depuis sa création, la société s'est appuyée sur ses solides compétences techniques et son équipe expérimentée pour...

Apr 15, 2025

Orange Lion Sports Smartshot intègre le grand modèle linguistique Tongyi, ouvrant une nouvelle ère pour le sport intelligent

Dans le contexte du développement rapide de la technologie, l'intelligence artificielle (IA) est devenue un outil essentiel pour améliorer l'efficacité et l'innovation dans tous les secteurs. Récemment, Orange Lion Sports a officiellement annoncé que son assistant d'imagerie sportive IA, « Orange Lion Huying Smartshot », a été intégré au dernier modèle d'inférence open source de Tongyi Qianwen, QwQ-32B. Cette initiative marque une mise à niveau technologique majeure pour Smartshot en termes d'analyse des performances des athlètes et d'enregistrement des données. Smartshot était initialement basé sur la vision par ordinateur et les techniques d'apprentissage automatique,

Apr 15, 2025

Lancement officiel du nouveau site Web de Zhipu : http://z.ai

Le nouveau site Web officiel de Beijing Zhipu Huazhang Technology Co., Ltd. (ci-après dénommé Zhipu), https://z.ai, est désormais entièrement en ligne. Selon AIbase, cette plateforme intègre les derniers modèles GLM de conversation, de raisonnement et de contemplation, et est désormais disponible gratuitement pour tous les utilisateurs du monde entier.

Apr 15, 2025

Le grand modèle linguistique Zhiyu d'Yiren Technology obtient son enregistrement : une étape clé vers la conformité, l'IA au service d'un nouvel avenir pour la finance

Yiren Technology (code boursier américain : YRD) a récemment annoncé que son grand modèle linguistique Zhiyu, développé en interne, a officiellement été enregistré conformément aux dispositions du « Règlement provisoire sur la gestion des services d'intelligence artificielle générative ». Cette annonce marque une étape importante pour Yiren Technology sur la voie de la conformité technologique en matière d'IA, et pose également les bases solides de ses applications intelligentes dans le secteur financier. En tant que fournisseur de services financiers axés sur l'IA parmi les plus importants de Chine, Yiren Technology est en train de stimuler la transformation du secteur grâce à l'innovation technologique. Note sur l'image : Image générée par IA, fournisseur de services d'autorisation d'images Midjour.

Apr 10, 2025

NVIDIA révolutionne le secteur avec Llama 3.1 Nemotron Ultra 253B : un nouveau standard de performance pour l'IA

NVIDIA, géant mondial des puces et de l'IA, a récemment lancé un nouveau grand modèle linguistique open source : Llama 3.1 Nemotron Ultra 253B, suscitant un vif intérêt dans le domaine de l'intelligence artificielle. Ce modèle, basé sur Llama-3.1-405B de Meta, bénéficie d'optimisations techniques innovantes. Il surpasse non seulement des concurrents puissants tels que Llama 4 Behemoth et Maverick en termes de performances, mais il se distingue également par son efficacité énergétique et ses capacités multitâches exceptionnelles, ouvrant de nouvelles perspectives pour l'A...

Apr 9, 2025

100

Nouveau modèle open source DeepCoder : programmation ultra-efficace, surpassant le modèle o1 d'OpenAI

Dans le contexte de l'évolution rapide des technologies, l'intelligence artificielle (IA) ne cesse de progresser. Récemment, le nouveau modèle DeepCoder-14B-Preview, mis en open source par la célèbre plateforme d'entraînement de grands modèles Together AI et la plateforme d'agents intelligents Agentica, a suscité un vif intérêt. Avec seulement 14 milliards de paramètres, ce modèle a obtenu un score de 60,6 % sur la plateforme de test de code LiveCodeBench, surpassant le modèle o1 d'OpenAI (59,5 %), avec une légère marge.

Apr 9, 2025

100

Meta lance Llama 4, un grand modèle linguistique révolutionnaire basé sur une architecture d'experts mixtes

Meta a dévoilé son dernier modèle d'intelligence artificielle open source, Llama 4, marquant une avancée majeure dans le domaine de l'IA. Llama 4 est disponible en deux versions, Scout et Maverick, conçues pour améliorer les fonctionnalités et les performances des modèles d'IA. Meta affirme que Llama 4 est un grand modèle multimodale capable de traiter divers types de données, notamment du texte, des images, des vidéos et de l'audio, et de convertir librement entre ces formats. Il est à noter que la série Llama 4 est la première...

Apr 7, 2025

Bulletin IA : Le modèle open source d'Alibaba, Tongyi Qianwen, arrive en tête du classement mondial ; MiniMax lance le modèle vocal Speech-02 ; Le nombre d'utilisateurs payants de ChatGPT atteint 20 millions

Bienvenue à la rubrique 【Bulletin IA】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en nous concentrant sur les développeurs, pour vous aider à comprendre les tendances technologiques et les nouvelles applications des produits d'IA innovants. Découvrez les nouveaux produits IA : https://top.aibase.com/1. Le modèle Qwen-2.5-Omni d'Alibaba Tongyi Qianwen arrive en tête du classement mondial des modèles open source Le 2 avril 2024, HuggingFace a publié le dernier classement des grands modèles, et le modèle Qwe d'Alibaba...

Apr 2, 2025

120

Actualités IA

IA Quotidien

Chronologie de l'IA

Al hardware

Derniers cas

Collection d'images

Collection de vidéos

Collection audio

Collection de contenu

Derniers tutoriels

Classement des produits IA

Classement de la croissance du trafic IA

Classement de la baisse du trafic IA

Classement hebdomadaire de l'IA

États-Unis

Chine

Inde

Brésil

Génération d'images

Assistant personnel

Génération de personnages

Génération de vidéos

Classement des projets IA

Classement de la croissance des projets IA

Classement des développeurs IA

Classement des organisations IA

Deepseek

TTS

LLM

ChatGPT

Aperçu

智谱AI采用新域名Z.ai 并开源32B/9B系列GLM模型

AIbase基地

Cet article provient d'AIbase Daily

Recommandations d'actualités IA connexes

Hugging Face acquiert Pollen Robotics et ouvre une nouvelle ère pour la robotique

Lancement de MiniMax, un grand modèle linguistique d'IA chinois, sur la plateforme Internet du supercalculateur national pour promouvoir l'écosystème open source de l'IA et le développement de nouvelles interactions intelligentes

智谱AI正式启动IPO辅导，力争成为A股首家大模型公司

Orange Lion Sports Smartshot intègre le grand modèle linguistique Tongyi, ouvrant une nouvelle ère pour le sport intelligent

Lancement officiel du nouveau site Web de Zhipu : http://z.ai

Le grand modèle linguistique Zhiyu d'Yiren Technology obtient son enregistrement : une étape clé vers la conformité, l'IA au service d'un nouvel avenir pour la finance

NVIDIA révolutionne le secteur avec Llama 3.1 Nemotron Ultra 253B : un nouveau standard de performance pour l'IA

Nouveau modèle open source DeepCoder : programmation ultra-efficace, surpassant le modèle o1 d'OpenAI

Meta lance Llama 4, un grand modèle linguistique révolutionnaire basé sur une architecture d'experts mixtes

Bulletin IA : Le modèle open source d'Alibaba, Tongyi Qianwen, arrive en tête du classement mondial ; MiniMax lance le modèle vocal Speech-02 ; Le nombre d'utilisateurs payants de ChatGPT atteint 20 millions