智谱AI：API接口GLM-4-Flash大型语言模型向公众免费开放

AIbase基地

Publié leActualités IA · 3 minutes de lecture · Aug 27, 2024

1.0k

Beijing Zhihu Huazhang Technology Co., Ltd. a récemment annoncé la mise à disposition gratuite au public de l'API de son grand modèle linguistique GLM-4-Flash, afin de promouvoir la popularisation et l'application de cette technologie.

Le modèle GLM-4-Flash présente des avantages significatifs en termes de vitesse et de performances, notamment en ce qui concerne la vitesse d'inférence. Grâce à des mesures d'optimisation telles que la quantification adaptative des poids, le traitement parallèle, les stratégies de traitement par lots et l'échantillonnage spéculatif, il a atteint une vitesse stable de 72,14 jetons/s, une performance remarquable parmi les modèles similaires.

Zhihu AI

En termes d'optimisation des performances, le modèle GLM-4-Flash a utilisé 10 To de données multilingues de haute qualité lors de la phase de pré-entraînement. Cela lui permet non seulement de gérer des tâches telles que les dialogues multitours, la recherche sur le web et l'appel d'outils, mais aussi de prendre en charge l'inférence sur de longs textes, avec une longueur de contexte maximale pouvant atteindre 128 K. De plus, ce modèle prend en charge 26 langues, dont le chinois, l'anglais, le japonais, le coréen et l'allemand, démontrant ainsi ses puissantes capacités multilingues.

Afin de répondre aux besoins spécifiques des différents utilisateurs, Zhihu AI propose également une fonction d'ajustement fin du modèle, permettant aux utilisateurs d'adapter au mieux le modèle GLM-4-Flash à divers scénarios d'application. Cette initiative de Zhihu AI vise à permettre à un public plus large d'expérimenter et d'utiliser les technologies de grands modèles avancés, afin d'étendre encore les limites d'application de l'IA.

Adresse de l'interface : https://open.bigmodel.cn/dev/api#glm-4

Plateforme nationale d'internet de supercalcul intégrée au grand modèle linguistique Qwen d'Alibaba : API QwQ-32B disponible

Selon les informations, la plateforme nationale d'internet de supercalcul a annoncé l'intégration du grand modèle linguistique Qwen d'Alibaba, offrant officiellement le service d'API QwQ-32B. Les utilisateurs peuvent obtenir gratuitement jusqu'à 1 million de jetons lors de l'utilisation de ce service, offrant ainsi une excellente opportunité aux développeurs et aux chercheurs. QwQ-32B est le dernier modèle d'inférence open source de l'équipe Alibaba Tongyi, affichant d'excellentes performances. Selon plusieurs données d'évaluation faisant autorité, les capacités de QwQ-32B sont comparables à celles d'un modèle 671B à pleine puissance.

Shenzhen prévoit de créer un fonds de capital d'État de 500 milliards de yuans, axé sur l'IA et la robotique

Selon des informations de Jie Mian News, la Commission des actifs d'État de Shenzhen a annoncé son intention de créer un fonds de capital d'État d'un montant de 500 milliards de yuans, axé sur les technologies de pointe telles que l'intelligence artificielle et la robotique. Conformément au plan, les entreprises publiques de Shenzhen, s'appuyant sur les décisions du Comité municipal et du gouvernement municipal, créeront activement un réseau de fonds d'innovation technologique couvrant toute la chaîne industrielle « 20+8 ». Ce fonds vise à fournir un soutien financier aux entreprises technologiques à tous les stades, de la phase de démarrage et des tours d'amorçage (Angel) aux tours A, B, C et jusqu'à l'introduction en bourse (IPO). Source de l'image : remarque

Actualités IA

智谱AI：API接口GLM-4-Flash大型语言模型向公众免费开放

AIbase基地

Recommandations d'actualités IA connexes

Plateforme nationale d'internet de supercalcul intégrée au grand modèle linguistique Qwen d'Alibaba : API QwQ-32B disponible

Babel, le grand modèle linguistique open source d'Alibaba, prend en charge 25 langues et touche 90% de la population mondiale

Shenzhen prévoit de créer un fonds de capital d'État de 500 milliards de yuans, axé sur l'IA et la robotique

Une nuit de viralité ! L'équipe derrière le nouveau produit IA Manus s'appelle Effet Papillon