La plateforme ouverte d'intelligence artificielle Zhipu AI a récemment annoncé la mise à disposition gratuite et publique du modèle GLM-4-Flash. Les utilisateurs peuvent créer gratuitement leurs propres modèles et applications après une simple inscription sur bigmodel.cn. Cette initiative devrait déclencher une nouvelle vague d'innovation dans le domaine des applications d'IA.
Le modèle GLM-4-Flash est réputé pour sa vitesse et son économie, particulièrement adapté aux tâches simples nécessitant une réponse rapide. Il prend en charge les conversations à plusieurs tours, la navigation web, les appels de fonctions et le raisonnement sur de longs textes, couvrant 26 langues dont le chinois, l'anglais, le japonais, le coréen et l'allemand. Ses applications sont vastes, incluant le prétraitement de données scientifiques, l'extraction d'informations, la traduction multilingue et les conversations à plusieurs tours.
Sur le plan technique, GLM-4-Flash optimise son efficacité grâce à la quantification adaptative des poids, la parallélisation, les stratégies de traitement par lots et l'échantillonnage spéculatif, réduisant ainsi considérablement les coûts d'inférence. La phase de pré-entraînement utilise un modèle de langage de grande taille pour filtrer les données, obtenant plus de 10 To de données multilingues de haute qualité, soit plus du triple du modèle ChatGLM3-6B. Parallèlement, l'utilisation de la technologie FP8 améliore considérablement l'efficacité du pré-entraînement.
En termes de performance, GLM-4-Flash excelle dans les tests de capacité de raisonnement logique, avec une vitesse de génération de 72,14 jetons/s (environ 115 caractères/s), juste derrière GPT-3.5-turbo. De plus, le modèle possède une capacité de recherche web en temps réel, permettant d'accéder rapidement à des informations telles que la météo et les actualités. Ses capacités d'appel de fonctions sont comparables à celles de GPT-4.
Les applications de GLM-4-Flash ont déjà démontré leur potentiel dans plusieurs domaines. Des biologistes l'utilisent pour traiter des données moléculaires et explorer les codes de la santé ; des développeurs l'utilisent pour générer des données d'entraînement, contribuant à la croissance d'autres grands modèles ; des chercheurs universitaires créent des assistants pédagogiques IA pour améliorer l'expérience d'apprentissage ; des développeurs d'applications de traduction l'utilisent pour développer des outils d'apprentissage interactif de l'anglais pour enfants ; et les agences de publicité l'utilisent pour peaufiner les textes et améliorer l'efficacité de la rédaction.
Pour encourager les retours utilisateurs, la plateforme ouverte Zhipu AI propose un bonus d'ajustement fin gratuit à durée limitée : répondez à un questionnaire pour obtenir un pack de ressources d'entraînement de 5 millions de jetons (3 mois). Offre limitée dans le temps, premier arrivé, premier servi.
Adresse d'accès : https://bigmodel.cn/console/trialcenter?modelCode=glm-4-flash