MEMO
Modèle de génération de vidéo expressive et riche en émotions, piloté par l'audio
Produit OrdinaireVidéoGénération de vidéoPiloté par l'audio
MEMO est un modèle de poids ouvert avancé pour la génération de vidéos parlantes pilotées par l'audio. Le modèle améliore la cohérence d'identité à long terme et la fluidité des mouvements grâce à un module temporel guidé par la mémoire et un module audio sensible aux émotions. Il affine simultanément les expressions faciales en détectant les émotions dans l'audio, générant ainsi des vidéos parlantes cohérentes et expressives. Les principaux avantages de MEMO incluent une génération de vidéos plus réaliste, une meilleure synchronisation audio-labiale, une cohérence d'identité et un alignement des émotions faciales. Les informations techniques montrent que MEMO génère des vidéos parlantes plus réalistes dans divers types d'images et d'audio, surpassant les méthodes de pointe existantes.
MEMO Dernière situation du trafic
Nombre total de visites mensuelles
700
Taux de rebond
58.65%
Nombre moyen de pages par visite
1.0
Durée moyenne de la visite
00:00:00