FLOAT
Méthode de génération de vidéos de portrait parlant pilotée par l'audio, basée sur l'appariement de flux
Produit OrdinaireImageIntelligence artificielleAnimation de portrait
FLOAT est une méthode de génération de vidéos de portrait parlant pilotée par l'audio. Elle repose sur un modèle de génération par appariement de flux, transférant la modélisation de la génération d'un espace latent basé sur les pixels vers un espace latent de mouvement appris, ce qui permet une conception de mouvement cohérente dans le temps. Cette technique introduit un prédicteur de champ vectoriel basé sur un transformateur et possède un mécanisme conditionnel par image simple et efficace. De plus, FLOAT prend en charge l'augmentation émotionnelle pilotée par la voix, permettant d'intégrer naturellement des mouvements expressifs. De nombreuses expériences montrent que FLOAT surpasse les méthodes existantes de portrait parlant piloté par l'audio en termes de qualité visuelle, de fidélité du mouvement et d'efficacité.
FLOAT Dernière situation du trafic
Nombre total de visites mensuelles
2062
Taux de rebond
55.17%
Nombre moyen de pages par visite
1.1
Durée moyenne de la visite
00:00:01