MEMO

Modèle de génération de vidéo expressive et riche en émotions, piloté par l'audio

Produit OrdinaireVidéoGénération de vidéoPiloté par l'audio
MEMO est un modèle de poids ouvert avancé pour la génération de vidéos parlantes pilotées par l'audio. Le modèle améliore la cohérence d'identité à long terme et la fluidité des mouvements grâce à un module temporel guidé par la mémoire et un module audio sensible aux émotions. Il affine simultanément les expressions faciales en détectant les émotions dans l'audio, générant ainsi des vidéos parlantes cohérentes et expressives. Les principaux avantages de MEMO incluent une génération de vidéos plus réaliste, une meilleure synchronisation audio-labiale, une cohérence d'identité et un alignement des émotions faciales. Les informations techniques montrent que MEMO génère des vidéos parlantes plus réalistes dans divers types d'images et d'audio, surpassant les méthodes de pointe existantes.
Ouvrir le site Web

MEMO Dernière situation du trafic

Nombre total de visites mensuelles

700

Taux de rebond

58.65%

Nombre moyen de pages par visite

1.0

Durée moyenne de la visite

00:00:00

MEMO Tendance des visites

MEMO Distribution géographique des visites

MEMO Sources de trafic

MEMO Alternatives