VideoTetris
Cadre innovant de génération de vidéo à partir de texte
Nouveau Produit PremiumVidéoTexte vers vidéoGénération vidéo
VideoTetris est un cadre novateur qui permet la génération de vidéos à partir de texte, particulièrement adapté à la génération de vidéos complexes contenant plusieurs objets ou dont le nombre d'objets varie dynamiquement. Ce cadre, grâce à une technique de diffusion spatio-temporelle combinée, suit précisément la sémantique textuelle complexe et opère en manipulant et combinant les cartes d'attention spatiales et temporelles des réseaux de débruitage. De plus, il introduit un nouveau mécanisme d'attention sur l'image de référence pour améliorer la cohérence de la génération vidéo auto-régréssive. VideoTetris obtient des résultats qualitatifs et quantitatifs impressionnants en matière de génération combinée de vidéos à partir de texte.