Kuaishou lance CineMaster : un ControlNet vidéo pour la génération de vidéos avec perception 3D précise

AIbase基地

Publié leActualités IA · 3 minutes de lecture · Feb 13, 2025

397

Kuaishou a récemment lancé CineMaster, un nouveau framework de génération de vidéo à partir de texte doté de capacités de perception 3D, qualifié de version vidéo de ControlNet. CineMaster permet aux utilisateurs de contrôler précisément la position des objets et le mouvement de la caméra dans la vidéo générée grâce à de multiples signaux de contrôle, offrant ainsi une liberté de création sans précédent.

Le principal atout de CineMaster réside dans ses puissantes capacités de contrôle. Les utilisateurs peuvent non seulement générer des vidéos à partir d'invites textuelles traditionnelles, mais aussi les affiner grâce aux signaux de contrôle suivants :

Carte de profondeur : utilisée pour contrôler les informations de profondeur de la scène et les relations spatiales entre les objets.

Trajectoire de la caméra : permet de spécifier précisément la trajectoire de la caméra dans la vidéo, pour réaliser des effets de caméra complexes.

Étiquettes d'objets : utilisées pour marquer et contrôler la position et le comportement d'objets spécifiques dans la scène.

En combinant ces signaux de contrôle, les utilisateurs peuvent maîtriser précisément le contenu vidéo généré et créer des œuvres plus créatives et personnalisées.

Par ailleurs, Kuaishou fournit un processus d'extraction des bounding boxes 3D et des trajectoires de caméra à partir de vidéos à grande échelle, offrant ainsi un solide support de données pour l'entraînement et l'application de CineMaster.

La page du projet CineMaster est en ligne. Les utilisateurs intéressés peuvent la consulter à l'adresse cinemaster-dev.github.io/.

CineMaster Génération vidéo Perception 3D ControlNet

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

Veo 2 débarque en force sur l'API Gemini : la révolution de la génération vidéo par IA est lancée

L'équipe d'intelligence artificielle de Google a récemment annoncé que Veo 2, son modèle de génération vidéo très attendu, est désormais accessible aux développeurs via l'API Gemini. Cette nouvelle a rapidement suscité l'enthousiasme dans le monde de la technologie, marquant une nouvelle étape dans le développement de la technologie de génération vidéo par IA. À compter d'aujourd'hui, tous les développeurs ayant activé la facturation et ayant atteint le niveau 1 ou supérieur peuvent utiliser l'API pour appeler Veo 2 et découvrir ses puissantes fonctionnalités de texte vers vidéo (Text-to-Video) et d'image vers vidéo (Image-to-Video).

Apr 10, 2025

Lancement de SkyReels-A2, un nouveau framework de génération vidéo : une innovation majeure pour la génération vidéo contrôlable

Récemment, l'équipe de recherche de Skywork AI a lancé SkyReels-A2, un nouveau framework de génération vidéo marquant une avancée significative dans la génération vidéo contrôlable. Ce framework, appelé "Élément vers vidéo (E2V)", permet de synthétiser des vidéos naturelles à partir d'invites textuelles, combinant divers éléments visuels (personnages, objets, arrière-plans) tout en maintenant une forte cohérence avec une image de référence. Au cœur de SkyReels-A2 se trouve un processus de traitement de données complexe. L'équipe de recherche a conçu un pipeline complet de construction de données.

Apr 8, 2025

Runway lance Gen-4 Turbo : la génération vidéo IA atteint de nouveaux sommets de vitesse

Apr 8, 2025

ByteDance lance DreamActor-M1 : implémentation de la fonctionnalité Runway Act, repoussant les limites de la génération d'animations

ByteDance a récemment dévoilé son dernier projet IA, DreamActor-M1, une avancée majeure dans le domaine de la génération vidéo. Ce modèle, en combinant une photo statique et une vidéo de référence des mouvements, permet de remplacer sans faille le personnage de la photo dans la scène vidéo, générant ainsi une image dynamique avec des expressions subtiles, des mouvements naturels et une haute qualité d'image. Cette innovation marque une nouvelle percée de ByteDance dans le domaine de l'IA générative et représente un défi aux outils existants de génération d'animation (comme Runway).

Apr 3, 2025

Gen-4 : Runway dévoile un modèle de génération vidéo IA époustouflant - Cohérence des personnages et des scènes incroyablement réaliste

Runway a lancé Gen-4, un nouveau modèle d'IA capable de générer des vidéos avec une cohérence impressionnante des personnages et des scènes. Les résultats sont si réalistes qu'ils semblent presque surnaturels.

Apr 1, 2025

Succès de données synthétiques ! AccVideo permet une génération vidéo haute qualité, 8,5 fois plus rapide

Dans le domaine de la génération vidéo par intelligence artificielle, les modèles de diffusion sont reconnus pour leurs performances exceptionnelles. Cependant, leur nature itérative de réduction du bruit rend le processus de génération long et coûteux en calcul, ce qui constitue un frein majeur à leur adoption généralisée. Récemment, une équipe de recherche conjointe de l'Université des sciences et technologies de l'aéronautique et de l'astronautique de Beijing, de l'Université de Hong Kong et du Shanghai AI Laboratory a publié une technologie innovante nommée AccVideo. Cette méthode, grâce à une nouvelle méthode de distillation efficace et à l'utilisation d'un ensemble de données synthétiques, a réussi à accélérer la génération de modèles de diffusion vidéo d'un facteur impressionnant de 8,5.

Mar 27, 2025

100

Keling AI dépasse les 100 millions de revenus, principalement grâce aux abonnements grand public

Dans le domaine de l'intelligence artificielle, Keling AI, lancé par Kuaishou, se fait progressivement remarquer, devenant un outsider dans les applications de génération vidéo. Selon la dernière conférence téléphonique sur les résultats, Cheng Yixiao, fondateur et PDG de Kuaishou, a révélé que depuis son lancement en juin dernier, Keling AI a généré plus de 100 millions de revenus, devenant ainsi le produit commercial le plus important dans le secteur des applications de génération vidéo en Chine. Grâce à ses fonctionnalités puissantes et à son déploiement précoce sur le marché, Keling AI a su se tailler une place de choix sur le marché concurrentiel de l'IA. Cheng Yixiao a souligné que, grâce à l'IA...

Mar 26, 2025

Kuaishou publie son rapport financier : investissement total dans les grands modèles vidéo, succès commercial initial de KeLing AI

Le 25 mars, Kuaishou a publié ses résultats annuels 2024, affichant un chiffre d'affaires total en hausse de 11,8 % à 126,9 milliards de yuans, et un bénéfice net ajusté de 17,7 milliards de yuans, en hausse significative de 72,5 %. Le point fort du rapport financier réside dans les progrès rapides de la commercialisation de KeLing AI, son grand modèle de génération vidéo lancé en juin dernier. À fin février, ses revenus cumulés dépassaient déjà les 100 millions de yuans. KeLing AI propose un modèle d'abonnement payant aux consommateurs et a établi des partenariats d'abonnement API avec des milliers d'entreprises. Le PDG de Kuaishou, Cheng Yixiao, a révélé lors de la conférence téléphonique sur les résultats que KeLing AI servait déjà...

Mar 26, 2025

Défier Sora ? Open-Sora 2.0, le modèle vidéo open source de Luocheng Technology, réduit les coûts et accélère la vitesse

Vous avez entendu parler du luxueux OpenAI Sora ? Avec un coût de formation se chiffrant à plusieurs millions de dollars, il s'agit véritablement du Rolls-Royce du monde de la génération vidéo. Désormais, Luocheng Technology annonce la version open source de son modèle de génération vidéo, Open-Sora 2.0 ! Pour seulement 200 000 $ (l'équivalent de 224 GPU), une réussite impressionnante : un modèle de génération vidéo commercial de 11 milliards de paramètres a été entraîné. Ses performances rivalisent avec celles d'OpenAI Sora. Ne vous laissez pas tromper par le faible coût d'Open-Sora 2.0…

Mar 13, 2025

Le nouveau modèle de génération et d'édition vidéo VACE d'Alibaba Tongyi permet de contrôler les trajectoires de mouvement, de remplacer des sujets, etc.

Vous trouvez toujours la création vidéo trop complexe et le montage trop fastidieux ? Ne vous inquiétez pas, l'équipe Alibaba Tongyi Wan lance son nouveau modèle phare : le modèle de génération et d'édition vidéo tout-en-un, VACE. L'une des capacités les plus remarquables de VACE est sa puissante fonction de génération vidéo conditionnelle. Cela signifie que vous n'avez qu'à décrire votre scène par écrit, et VACE transformera rapidement votre imagination en réalité. C'est comme avoir une équipe de tournage de rêve à votre disposition, avec une efficacité étonnante ! VAC

Mar 13, 2025

Actualités IA

IA Quotidien

Chronologie de l'IA

Al hardware

Derniers cas

Collection d'images

Collection de vidéos

Collection audio

Collection de contenu

Derniers tutoriels

Classement des produits IA

Classement de la croissance du trafic IA

Classement de la baisse du trafic IA

Classement hebdomadaire de l'IA

États-Unis

Chine

Inde

Brésil

Génération d'images

Assistant personnel

Génération de personnages

Génération de vidéos

Classement des projets IA

Classement de la croissance des projets IA

Classement des développeurs IA

Classement des organisations IA

Deepseek

TTS

LLM

ChatGPT

Aperçu