Actualités IA

Ne manquez aucun moment de l'innovation mondiale en IA

IA Quotidien

Tendances quotidiennes de l'industrie de l'IA en trois minutes

Chronologie de l'IA

Jalons de l'industrie de l'IA

Guide de monétisation de l'IA

Derniers cas

Partage de cas de monétisation de l'IA

Collection d'images

Cas de monétisation de la création d'images par l'IA

Collection de vidéos

Cas de monétisation de la création de vidéos par l'IA

Collection audio

Cas de monétisation de la création audio par l'IA

Collection de contenu

Cas de monétisation de la rédaction de contenu par l'IA

Tutoriels IA

Derniers tutoriels

Partage gratuit des derniers tutoriels IA

Classements des produits IA

Classement des produits IA

Affiche le classement du nombre total de visites des sites web d'IA

Classement de la croissance du trafic IA

Suit les sites web d'IA à la croissance la plus rapide en termes de trafic

Classement de la baisse du trafic IA

Se concentre sur les sites web d'IA avec des baisses de trafic importantes

Classement hebdomadaire de l'IA

Affiche le classement hebdomadaire des visites des sites web d'IA

Classements des pays populaires

États-Unis

Sites web d'IA les plus populaires auprès des utilisateurs américains

Chine

Sites web d'IA les plus populaires auprès des utilisateurs chinois

Inde

Sites web d'IA les plus populaires auprès des utilisateurs indiens

Brésil

Sites web d'IA les plus populaires auprès des utilisateurs brésiliens

Classements des catégories populaires

Génération d'images

Classement du nombre total de visites des sites web de génération d'images par l'IA

Assistant personnel

Classement du nombre total de visites des sites web d'assistants personnels d'IA

Génération de personnages

Classement du nombre total de visites des sites web de génération de personnages par l'IA

Génération de vidéos

Classement du nombre total de visites des sites web de génération de vidéos par l'IA

Classements des données Open Source populaires

Classement des projets IA

Projets IA populaires sur GitHub par nombre total d'étoiles

Classement de la croissance des projets IA

Projets IA populaires sur GitHub par taux de croissance

Classement des développeurs IA

Classement des développeurs IA populaires sur GitHub

Classement des organisations IA

Classement des organisations IA populaires sur GitHub

Catégories Open Source populaires

Deepseek

Projets Open Source Deepseek populaires sur GitHub

TTS

Projets Open Source TTS populaires sur GitHub

LLM

Projets Open Source LLM populaires sur GitHub

ChatGPT

Projets Open Source ChatGPT populaires sur GitHub

Bibliothèque de projets Open Source IA

Aperçu

Aperçu des projets Open Source IA populaires sur GitHub

Bibliothèque de produits Navigation de l'outil

智谱发布GLM-4-Air、GLM-4V-Plus模型，推出Flash全模态免费模型

AIbase基地

Publié leActualités IA · 6 minutes de lecture · Jan 16, 2025

545

Beijing Zhipu Huazhang Technology Co., Ltd. a annoncé le 16 janvier 2025 le lancement d'une série de nouveaux modèles, disponibles sur bigmodel.cn. Après le lancement de « Zhipu Qingyan » en août, la société a approfondi ses recherches dans les domaines de la compréhension et de la génération du langage, de la voix, des images et des vidéos, donnant naissance à des modèles multimodaux tels que GLM-Voice, GLM-4V, CogView et CogVideoX.

Le nouveau modèle de bout en bout GLM-Realtime, lancé cette fois-ci, offre une compréhension vidéo et une interaction vocale à faible latence. Il intègre une fonction de chant et prend en charge une mémoire de 2 minutes ainsi que la fonction Function Call. La société a également mis à niveau simultanément les modèles GLM-4-Air et GLM-4V-Plus, visant à fournir des solutions de modèles linguistiques offrant les meilleures performances et le meilleur rapport qualité-prix du secteur. Zhipu s'engage à faire profiter la société des technologies de modèles de grande taille avancées et a créé le modèle Flash multi-modal gratuit, couvrant plusieurs scénarios tels que le langage, la génération d'images à partir de texte, la génération de vidéos à partir de texte et la compréhension d'images, pour aider les développeurs à innover facilement.

微信截图_20250116150923.png

GLM-Realtime possède une capacité de mémoire de 2 minutes pour les appels vidéo et, pour l'interaction vocale, intègre de manière innovante une fonction de chant, permettant au grand modèle de chanter pendant une conversation. La société a intégré l'API Realtime à des lunettes intelligentes et à des poupées compagnons afin que les utilisateurs puissent bénéficier d'une interaction avec un assistant intelligent quasi instantanée. Realtime prend également en charge la fonction Function Call, lui permettant d'utiliser ses propres connaissances et capacités pour appeler de manière flexible des connaissances et des outils externes, étendant ainsi ses applications à des scénarios commerciaux plus vastes. L'API GLM-Realtime est disponible sur la plateforme ouverte de Zhipu, bigmodel.cn, et son utilisation est actuellement gratuite.

GLM-4-Air, apprécié des développeurs pour son excellent rapport qualité-prix depuis son lancement, est passé à la version GLM-4-Air-0111. Grâce à l'optimisation des données et des processus d'entraînement, ses performances atteignent, sur certains aspects, celles du modèle GLM-4-Plus, plus volumineux, tout en voyant son prix divisé par deux, réduisant ainsi le coût d'utilisation des grands modèles. Le modèle de compréhension visuelle GLM-4V-Plus a également été entièrement mis à niveau. La nouvelle version affiche des améliorations significatives dans plusieurs classements publics, prend en charge la résolution variable pour s'adapter aux images de différentes tailles, réduit considérablement la consommation de jetons pour les petites images, prend en charge la reconnaissance sans perte d'images 4K ultra-haute définition et d'images avec des rapports largeur/hauteur extrêmes, et possède une capacité de compréhension vidéo de 2 heures, offrant une solution efficace et précise pour la compréhension et l'analyse de longues vidéos.

Zhipu s'engage à rendre les grands modèles accessibles à tous. Pour soutenir l'innovation des développeurs, il a mis en place une série d'API de modèles Flash gratuites pour l'ensemble de la communauté. Première série de modèles gratuits multimodaux du secteur, elle permet aux développeurs d'utiliser gratuitement les fonctions de langage, de compréhension multimodale et de génération multimodale. La série Flash sera prochainement mise à niveau et comprendra les modèles suivants : le modèle linguistique GLM-4-Flash, le modèle de compréhension d'images GLM-4V-Flash, le modèle de génération d'images CogView-3-Flash et le modèle de génération de vidéos CogVideoX-Flash.

智谱华章 GLM-Voice CogView Flash全模态免费模型

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

智谱AI获得北京市人工智能产业投资基金投资，成为该基金投资的首家AI大模型公司

Selon les informations affichées sur l'application Tianyancha, la société liée à ZhiPu AI, Beijing ZhiPu Huazhang Technology Co., Ltd., a récemment subi des modifications de son enregistrement commercial. De nouveaux actionnaires ont été ajoutés, notamment le Fonds d'investissement industriel pour l'intelligence artificielle de Beijing (société en commandite), le Shenzhen Zhicheng Digital Innovation Private Equity Investment Fund Partnership (société en commandite) et le Hubei Changjiang Citic Telecom Technology Industry Investment Fund Partnership (société en commandite). Le capital social a également augmenté, passant d'environ 27,91 millions de RMB à environ 31,07 millions de RMB. Il est entendu que Beijing ZhiPu Huazhang Technology Co., Ltd. a été créée...

Nov 4, 2024

2.0k

智谱发布新一代基础模型GLM-4-Plus，清言应用程式升级视频通话功能

北京智谱华章科技有限公司于2024年8月29日宣布了一系列重要的技术更新，包括新一代基础模型的发布和新的应用服务。在KDD 2024大会上，智谱发布了新一代基础模型，包括语言模型GLM-4-Plus、文生图模型CogView-3-Plus、图像/视频理解模型GLM-4V-Plus和视频生成模型CogVideoX。这些模型在各自领域均达到国际领先水平。

Aug 30, 2024

4.7k