Upscale-A-Video
Modèle d'extension de super-résolution vidéo
Produit OrdinaireVidéoVidéoSuper-résolution
Upscale-A-Video est un modèle basé sur la diffusion qui améliore la résolution des vidéos en prenant en entrée des vidéos basse résolution et des invites textuelles. Le modèle assure la cohérence temporelle grâce à deux mécanismes clés : localement, il intègre des couches temporelles dans le U-Net et le VAE-Decoder pour maintenir la cohérence des séquences courtes ; globalement, il introduit un module de propagation latente itérative guidé par le flux, qui améliore la stabilité globale de la vidéo en propageant et en fusionnant les informations latentes sur toute la séquence. Grâce au paradigme de diffusion, notre modèle permet également de trouver un équilibre entre restauration et génération en autorisant les invites textuelles à guider la création de textures et un niveau de bruit réglable, permettant ainsi un compromis entre fidélité et qualité. De nombreuses expériences montrent qu'Upscale-A-Video surpasse les méthodes existantes sur les benchmarks synthétiques et du monde réel, ainsi que sur les vidéos générées par l'IA, en affichant un réalisme visuel et une cohérence temporelle impressionnants.
Upscale-A-Video Dernière situation du trafic
Nombre total de visites mensuelles
25532
Taux de rebond
52.84%
Nombre moyen de pages par visite
1.6
Durée moyenne de la visite
00:00:27