Actualités IA

Ne manquez aucun moment de l'innovation mondiale en IA

IA Quotidien

Tendances quotidiennes de l'industrie de l'IA en trois minutes

Chronologie de l'IA

Jalons de l'industrie de l'IA

Guide de monétisation de l'IA

Derniers cas

Partage de cas de monétisation de l'IA

Collection d'images

Cas de monétisation de la création d'images par l'IA

Collection de vidéos

Cas de monétisation de la création de vidéos par l'IA

Collection audio

Cas de monétisation de la création audio par l'IA

Collection de contenu

Cas de monétisation de la rédaction de contenu par l'IA

Tutoriels IA

Derniers tutoriels

Partage gratuit des derniers tutoriels IA

Classements des produits IA

Classement des produits IA

Affiche le classement du nombre total de visites des sites web d'IA

Classement de la croissance du trafic IA

Suit les sites web d'IA à la croissance la plus rapide en termes de trafic

Classement de la baisse du trafic IA

Se concentre sur les sites web d'IA avec des baisses de trafic importantes

Classement hebdomadaire de l'IA

Affiche le classement hebdomadaire des visites des sites web d'IA

Classements des pays populaires

États-Unis

Sites web d'IA les plus populaires auprès des utilisateurs américains

Chine

Sites web d'IA les plus populaires auprès des utilisateurs chinois

Inde

Sites web d'IA les plus populaires auprès des utilisateurs indiens

Brésil

Sites web d'IA les plus populaires auprès des utilisateurs brésiliens

Classements des catégories populaires

Génération d'images

Classement du nombre total de visites des sites web de génération d'images par l'IA

Assistant personnel

Classement du nombre total de visites des sites web d'assistants personnels d'IA

Génération de personnages

Classement du nombre total de visites des sites web de génération de personnages par l'IA

Génération de vidéos

Classement du nombre total de visites des sites web de génération de vidéos par l'IA

Classements des données Open Source populaires

Classement des projets IA

Projets IA populaires sur GitHub par nombre total d'étoiles

Classement de la croissance des projets IA

Projets IA populaires sur GitHub par taux de croissance

Classement des développeurs IA

Classement des développeurs IA populaires sur GitHub

Classement des organisations IA

Classement des organisations IA populaires sur GitHub

Catégories Open Source populaires

Deepseek

Projets Open Source Deepseek populaires sur GitHub

TTS

Projets Open Source TTS populaires sur GitHub

LLM

Projets Open Source LLM populaires sur GitHub

ChatGPT

Projets Open Source ChatGPT populaires sur GitHub

Bibliothèque de projets Open Source IA

Aperçu

Aperçu des projets Open Source IA populaires sur GitHub

Bibliothèque de produits Navigation de l'outil

Google lance VideoPoet, un modèle de génération de vidéos de 10 secondes avec audio

36氪

Publié leActualités IA · 2 minutes de lecture · Dec 22, 2023

Le 19 décembre, Google a lancé VideoPoet, un modèle de génération de vidéos. Ce modèle peut générer des vidéos d'une durée allant jusqu'à 10 secondes, et peut également générer automatiquement des musiques et des effets sonores en fonction du contenu vidéo. VideoPoet prolonge les vidéos en prédisant de manière répétitive l'image suivante à partir de la dernière image, donnant l'impression à l'utilisateur que la vidéo peut être prolongée indéfiniment. Contrairement à d'autres modèles, VideoPoet utilise un grand modèle linguistique plutôt qu'un modèle de diffusion, ce qui permet d'intégrer plusieurs fonctionnalités telles que la conversion de texte en vidéo, la réparation vidéo et la stylisation vidéo dans un seul et même modèle, offrant ainsi une plus grande flexibilité d'utilisation.

Génération vidéo Texte vers vidéo Multimodal

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

Rapport : OpenAI devrait lancer la série GPT-4.1 la semaine prochaine, incluant des versions Mini et Nano

OpenAI, leader de l'intelligence artificielle, s'apprête à lancer une nouvelle vague d'innovations technologiques la semaine prochaine ! Selon le média technologique The Verge, OpenAI prévoit de présenter une mise à jour majeure incluant la série GPT-4.1, la série o3 et plusieurs autres modèles d'IA. Cette série de lancements montre non seulement l'ambition d'OpenAI à accélérer l'innovation, mais offre également à l'industrie des outils IA plus puissants. Série GPT-4.1 : une mise à niveau complète des capacités multimodales En tant que successeur de GPT-4.0, la série GPT-4.1...

Apr 11, 2025

SenseTime lance un nouveau grand modèle multimodal, ouvrant la voie à une nouvelle ère d'interaction

Lors de la journée d'échanges technologiques de SenseTime le 10 avril, SenseTime a lancé son dernier grand modèle multimodal, SenseNova V6, ainsi que le système SenseCore 2.0. Ce nouveau grand modèle vise à intégrer plusieurs formes d'informations, telles que le texte, les images et les vidéos, afin d'offrir aux utilisateurs une expérience d'interaction plus naturelle et plus riche. La série SenseNova V6 lancée cette fois comprend quatre versions, dont la plus remarquable est SenseNova V6Pro.

Apr 10, 2025

Lancement révolutionnaire de SenseNova V6 de SenseTime : l'IA multimodale fait un bond en avant ! API disponible dès demain !

SenseTime, par l’intermédiaire de son fondateur Xu Li, a récemment lancé SenseNova V6, sa nouvelle génération de modèle d’IA, une annonce qui a rapidement suscité un vif intérêt au sein de la communauté technologique. Selon AIbase, SenseNova V6 marque une avancée significative dans les capacités multimodales, renforçant la position de leader de SenseTime dans le domaine de l’IA. Plus enthousiasmant encore, l’API de ce modèle sera accessible dès demain, offrant aux développeurs un support technique plus puissant et facilitant l’implémentation rapide d’applications d’IA. Amélioration significative des capacités multimodales SenseNova V6, faisant partie de la gamme SenseTime Sens...

Apr 10, 2025

OmniSVG révolutionne la création d'images vectorielles : l'Université Fudan et Jieyue Xingchen créent une nouvelle référence en matière de génération d'images vectorielles multimodales

Récemment, l'Université Fudan et Jieyue Xingchen, une entreprise chinoise d'innovation en IA, ont annoncé le lancement imminent d'OmniSVG, un modèle de génération d'images SVG multimodales de bout en bout. Cette annonce a rapidement suscité un vif intérêt dans les domaines de la technologie et du design. Selon AIbase, OmniSVG se caractérise par sa puissante capacité de génération, prenant en charge la génération d'images vectorielles allant d'icônes simples à des personnages de dessins animés complexes, offrant ainsi une solution intelligente révolutionnaire pour la création artistique numérique. Ce modèle pourrait redéfinir les limites technologiques de la génération d'images vectorielles. Génération multimodale : flexibilité optimale

Apr 10, 2025

Veo 2 débarque en force sur l'API Gemini : la révolution de la génération vidéo par IA est lancée

L'équipe d'intelligence artificielle de Google a récemment annoncé que Veo 2, son modèle de génération vidéo très attendu, est désormais accessible aux développeurs via l'API Gemini. Cette nouvelle a rapidement suscité l'enthousiasme dans le monde de la technologie, marquant une nouvelle étape dans le développement de la technologie de génération vidéo par IA. À compter d'aujourd'hui, tous les développeurs ayant activé la facturation et ayant atteint le niveau 1 ou supérieur peuvent utiliser l'API pour appeler Veo 2 et découvrir ses puissantes fonctionnalités de texte vers vidéo (Text-to-Video) et d'image vers vidéo (Image-to-Video).

Apr 10, 2025

Bulletin IA : Alibaba et Tencent prennent entièrement en charge le protocole MCP ; Modèle d'inférence multimodale Step-R1-V-Mini de Jieyue Xingchen ; Modèle de génération d'images Miracle F1 de Meitu WHEE

Bienvenue à la rubrique 【Bulletin IA】 ! Votre guide quotidien pour explorer le monde de l'intelligence artificielle. Chaque jour, nous vous présentons les actualités les plus importantes du domaine de l'IA, en nous concentrant sur les développeurs, pour vous aider à comprendre les tendances technologiques et les applications innovantes des produits IA. Découvrez les nouveaux produits IA : https://top.aibase.com/1. Alibaba a annoncé son soutien total au protocole MCP, suivi de près par Tencent. Récemment, le domaine de l'intelligence artificielle en Chine a connu une transformation des normes technologiques, le protocole ModelContext (MCP) devenant une norme nationale pour l'IA...

Apr 9, 2025

Step-R1-V-Mini : Nouveau modèle d'inférence multimodale de Jieyue Xingchen

L'équipe de Jieyue Xingchen Technology est fière d'annoncer le lancement officiel de son nouveau modèle d'inférence multimodale, Step-R1-V-Mini. Ce lancement marque une avancée majeure dans le domaine de l'inférence multimodale collaborative et insuffle une nouvelle dynamique au développement de l'IA. Step-R1-V-Mini prend en charge les entrées texte et image et produit des sorties textuelles. Il possède une bonne capacité de suivi des instructions et une grande polyvalence, capable de percevoir les images avec précision et d'effectuer des tâches d'inférence complexes.

Apr 9, 2025

Lancement de SkyReels-A2, un nouveau framework de génération vidéo : une innovation majeure pour la génération vidéo contrôlable

Récemment, l'équipe de recherche de Skywork AI a lancé SkyReels-A2, un nouveau framework de génération vidéo marquant une avancée significative dans la génération vidéo contrôlable. Ce framework, appelé "Élément vers vidéo (E2V)", permet de synthétiser des vidéos naturelles à partir d'invites textuelles, combinant divers éléments visuels (personnages, objets, arrière-plans) tout en maintenant une forte cohérence avec une image de référence. Au cœur de SkyReels-A2 se trouve un processus de traitement de données complexe. L'équipe de recherche a conçu un pipeline complet de construction de données.

Apr 8, 2025

La fonction de conversation visuelle Gemini Live arrive sur Pixel 9 : l'assistant IA franchit une nouvelle étape vers une interaction multimodale

Apr 8, 2025

Runway lance Gen-4 Turbo : la génération vidéo IA atteint de nouveaux sommets de vitesse

Apr 8, 2025