FLATTEN
Plugin d'attention guidée par flux optique pour l'édition texte-vers-vidéo, assurant la cohérence.
Produit OrdinaireImageÉdition texte-vers-vidéoFlux optique
FLATTEN est un plugin d'attention guidée par flux optique pour l'édition texte-vers-vidéo. Il résout les problèmes de cohérence dans l'édition texte-vers-vidéo en introduisant le flux optique dans le U-Net du modèle de diffusion. FLATTEN améliore la cohérence visuelle des vidéos éditées en forçant les patchs sur les mêmes chemins de flux optique sur différentes images à s'attarder mutuellement dans le module d'attention. De plus, FLATTEN ne nécessite aucun entraînement et peut être intégré de manière transparente à toute méthode d'édition texte-vers-vidéo basée sur la diffusion, améliorant ainsi sa cohérence visuelle. Les résultats expérimentaux montrent que notre méthode atteint des performances de pointe sur les benchmarks existants d'édition texte-vers-vidéo. En particulier, notre méthode excelle dans le maintien de la cohérence visuelle des vidéos éditées.
FLATTEN Dernière situation du trafic
Nombre total de visites mensuelles
37
Taux de rebond
41.38%
Nombre moyen de pages par visite
1.0
Durée moyenne de la visite
00:00:00