El equipo de Alibaba ha lanzado EMO, un marco para la generación de videos de retratos que puede crear videos de retratos con expresiones faciales ricas y posturas de cabeza. EMO utiliza una red de referencia para extraer características de imágenes de referencia y fotogramas de movimiento, procesa el audio mediante un codificador de audio preentrenado y lo incrusta, y combina ruido multi-frame y máscaras de área facial para generar videos. Los resultados experimentales muestran que EMO supera a los métodos existentes en términos de expresividad y realismo. Las posibles aplicaciones de este modelo mejorarán el nivel de la tecnología de generación de medios digitales y contenido virtual, pero también podrían utilizarse con fines delictivos.
Alibaba lanza el marco de generación de videos de retratos EMO

开源中国
Este artículo proviene de AIbase Daily
¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.