Snap Vidéo
Snap Vidéo : un convertisseur spatio-temporel évolutif pour la synthèse texte-vidéo
Produit OrdinaireVidéoSynthèse vidéoTransformer
Snap Vidéo est un modèle privilégiant la vidéo qui s'attaque systématiquement aux défis de la fidélité du mouvement, de la qualité visuelle et de l'évolutivité dans le domaine de la génération vidéo, en étendant le framework EDM. Ce modèle exploite les informations redondantes entre les images et propose une architecture Transformer évolutive qui représente les dimensions spatiales et temporelles comme un vecteur latent 1D hautement compressé, permettant ainsi une modélisation conjointe spatio-temporelle efficace pour synthétiser des vidéos au mouvement complexe et à la cohérence temporelle élevée. Cette architecture permet un entraînement efficace du modèle, atteignant une échelle de plusieurs milliards de paramètres et obtenant des résultats optimaux sur plusieurs tests de référence.
Snap Vidéo Dernière situation du trafic
Nombre total de visites mensuelles
18354
Taux de rebond
52.83%
Nombre moyen de pages par visite
1.5
Durée moyenne de la visite
00:00:37