Lumière-Modèle de diffusion spatio-temporelle pour la génération de vidéos

Lumière est un modèle de diffusion texte-vidéo conçu pour synthétiser des vidéos présentant des mouvements réalistes, variés et cohérents, et pour résoudre les défis clés de la synthèse vidéo. Nous introduisons une architecture spatio-temporelle U-Net capable de générer la durée totale d'une vidéo en une seule passe. Cela contraste avec les modèles vidéo existants qui synthétisent des images clés distantes puis procèdent à une sur-résolution temporelle, méthode qui rend intrinsèquement difficile la cohérence temporelle globale. En déployant un sous-échantillonnage et un sur-échantillonnage spatiaux et (surtout) temporels, et en utilisant un modèle de diffusion texte-image pré-entraîné, notre modèle apprend à générer directement des vidéos à faible résolution et pleine fréquence d'images à plusieurs échelles spatio-temporelles. Nous démontrons des résultats de pointe en génération texte-vidéo et montrons comment notre conception facilite aisément diverses tâches de création de contenu et d'applications d'édition vidéo, notamment la conversion image-vidéo, la réparation vidéo et la génération stylisée.

Best AI Websites & Tools

Lumière

Lumière Dernière situation du trafic

Lumière Tendance des visites

Lumière Distribution géographique des visites

Lumière Sources de trafic

Lumière Alternatives

Lumière — Modèle de diffusion spatio-temporelle pour la génération de vidéos

AIGCPanel : Système de personnages numériques IA open source — Système de personnages numériques IA tout-en-un, prenant en charge la synthèse vidéo, la synthèse vocale et le clonage vocal.

AigcPanel — Système de création de personnages numériques IA tout-en-un, prenant en charge la synthèse vidéo, la synthèse vocale et le clonage vocal.

StableAnimator — Outil de synthèse d'animation de portrait de haute qualité préservant l'identité.

MIMO — Technique de synthèse vidéo avec personnages contrôlables

ViewCrafter — Modèle de diffusion vidéo permettant la synthèse de nouvelles perspectives haute fidélité.

SF-V — Modèle de génération vidéo en une seule étape permettant une synthèse vidéo de haute qualité.

Alignez vos pas — Méthode d'optimisation du calendrier d'échantillonnage des modèles de diffusion pour améliorer la qualité des sorties des modèles génératifs.

DynamiCrafter_1024 — Modèle de vidéo texte-vidéo générant des vidéos haute résolution avec des effets dynamiques.

Snap Vidéo — Snap Vidéo : un convertisseur spatio-temporel évolutif pour la synthèse texte-vidéo

Boximator — Outil de synthèse vidéo générant des mouvements riches et contrôlables.

FlowVid — Synthèse vidéo guidée par le flux optique

VividTalk — Génère des vidéos de rap réalistes avec synchronisation labiale.

Polymorf — Personnage vidéo à partir de texte

Charactr — Plateforme de génération de voix, vidéos et avatars virtuels par IA