FLOAT
Método de generación de vídeo de avatares parlantes impulsado por audio basado en la correspondencia de flujos
Producto ComúnImagenInteligencia ArtificialAnimación de retratos
FLOAT es un método de generación de vídeo de avatares parlantes impulsado por audio, basado en un modelo generativo de correspondencia de flujos. Este método traslada el modelado generativo del espacio latente basado en píxeles a un espacio latente de movimiento aprendido, logrando un diseño de movimiento temporalmente coherente. La tecnología introduce un predictor de campo vectorial basado en transformadores y cuenta con un mecanismo condicional por fotograma simple y efectivo. Además, FLOAT admite el aumento de emociones impulsado por voz, permitiendo la integración natural de movimientos expresivos. Amplios experimentos demuestran que FLOAT supera a los métodos existentes de avatares parlantes impulsados por audio en cuanto a calidad visual, fidelidad del movimiento y eficiencia.
FLOAT Situación del tráfico más reciente
Total de visitas mensuales
2062
Tasa de rebote
55.17%
Páginas promedio por visita
1.1
Duración promedio de la visita
00:00:01