Zhipu a annoncé le lancement de la série de modèles GLM-4-9B, comprenant un modèle de base, des modèles de chat avec différentes longueurs de contexte et un modèle visuel, surpassant largement les capacités de LLaMA38B. Le modèle GLM-4-9B est désormais disponible en open source sur Github, attirant l'attention de nombreux développeurs et chercheurs. Cette sortie est considérée comme une avancée majeure de Zhipu dans le domaine de l'intelligence artificielle.
GLM-4-9B est la version open source de la dernière génération de modèles pré-entraînés GLM-4 développée par Zhipu AI. Lors des évaluations sur des ensembles de données variés (sémantique, mathématiques, raisonnement, code et connaissances), GLM-4-9B et sa version alignée sur les préférences humaines, GLM-4-9B-Chat, ont démontré des performances supérieures à Llama-3-8B.
En plus de permettre des conversations à plusieurs tours, GLM-4-9B-Chat offre des fonctionnalités avancées telles que la navigation web, l'exécution de code, l'appel d'outils personnalisés (Function Call) et le raisonnement sur de longs textes (jusqu'à 128K de contexte).
Ce modèle intègre la prise en charge de plusieurs langues, incluant le japonais, le coréen et l'allemand, soit 26 langues au total. Nous avons également lancé GLM-4-9B-Chat-1M, un modèle prenant en charge un contexte de 1M (environ 2 millions de caractères chinois), et GLM-4V-9B, un modèle multi-modal basé sur GLM-4-9B.
GLM-4V-9B possède des capacités de dialogue multilingue (chinois et anglais) à haute résolution (1120*1120). Dans les évaluations multimodales portant sur les capacités globales en chinois et en anglais, le raisonnement perceptif, la reconnaissance de texte et la compréhension de graphiques, GLM-4V-9B a démontré des performances supérieures à GPT-4-turbo-2024-04-09, Gemini1.0Pro, Qwen-VL-Max et Claude3Opus.
Les internautes ont exprimé leur espoir que la série de modèles GLM-4-9B puisse stimuler le développement des technologies d'intelligence artificielle et qu'elle conduise à l'émergence de nouveaux produits intelligents. Ils ont également salué les compétences techniques et le pouvoir d'innovation de Zhipu.
Adresse du dépôt open source : https://github.com/THUDM/GLM-4
Adresse pour tester le modèle : https://modelscope.cn/studios/dash-infer/GLM-4-Chat-DashInfer-Demo/summary