Actualités IA

Top des produits IA

La fonctionnalité multimodale d'OpenAI ChatGPT est officiellement lancée, prenant en charge l'interaction vocale et la reconnaissance d'images

智能涌现

Publié leActualités IA · 1 minutes de lecture · Sep 26, 2023

Le 25 septembre, OpenAI a lancé plusieurs fonctionnalités multimodales pour ChatGPT, son populaire chatbot conversationnel, notamment l'interaction vocale et la reconnaissance d'images. Ces nouvelles fonctionnalités permettent aux utilisateurs d'interagir via la voix et le téléchargement d'images, offrant ainsi des capacités de reconnaissance vocale, de reconnaissance de texte et de détection d'objets. Cette version multimodale de ChatGPT, nommée GPT-4V, a été entraînée en même temps que GPT-4, mais sa sortie a été retardée par souci de sécurité. OpenAI a indiqué que ces nouvelles fonctionnalités seraient d'abord déployées pour les abonnés ChatGPT Plus et les utilisateurs de la version Entreprise.

ChatGPT OpenAI Multimodal

Recommandations d'actualités IA connexes

Huawei Ascend et Step-Video lancent un modèle multimodale open source, faisant leur entrée dans le nouveau domaine de l'IA

Récemment, la communauté Modelers a officiellement lancé Step-Video et Step-Audio, deux grands modèles multimodaux open source développés par Step-Video. Ces deux modèles sont respectivement utilisés pour la génération de vidéo et l'interaction vocale, visant à fournir aux développeurs et aux entreprises des outils IA plus performants. Step-Video, dont le nom complet est Step-Video-T2V, est un modèle de génération de vidéo open source parmi les plus grands au monde, avec un nombre de paramètres atteignant 30 milliards. Ce modèle est capable de générer directement des vidéos de 20...

Mar 10, 2025

Percée dans les avatars numériques IA ! Hedra lance Character-3 et Hedra Studio : inférence conjointe d'images, de texte et d'audio

Hedra révolutionne le domaine des avatars numériques IA avec le lancement de Character-3, un nouveau modèle capable d'inférence conjointe sur des données images, texte et audio, et de Hedra Studio, une plateforme innovante pour créer et interagir avec ces avatars.

Mar 9, 2025

16.1k

Lancement d'un site Web indépendant pour Tongyi Wanxiang, le modèle vidéo IA d'Alibaba

Alibaba a lancé un site Web indépendant pour son modèle vidéo IA, Tongyi Wanxiang, offrant ainsi un accès plus facile à cette technologie de pointe.

Mar 7, 2025

16.1k

Cohere lance Aya Vision, un nouveau modèle d'IA multimodale, en versions 32B et 8B

Cohere a dévoilé Aya Vision, son nouveau modèle d'IA multimodale puissant, disponible en deux versions : 32 milliards et 8 milliards de paramètres. Ce modèle offre des capacités avancées de traitement d'images et de texte.

Mar 6, 2025

16.0k