El nuevo marco de generación de videos de retratos impulsado por audio, EMO, desarrollado por el equipo del Instituto de Computación Inteligente de Alibaba, puede generar videos de cualquier duración a partir de una entrada de audio. Se trata de una tecnología de generación de video expresiva que representa una mejora significativa con respecto a los métodos de generación de video de IA anteriores, aunque también presenta el inconveniente de ser relativamente lento. Miembros del equipo, incluyendo a Liefeng Bo y otros, detallan el enfoque técnico y las características de EMO en su artículo. Esta nueva tecnología supone un gran avance en el campo de la IA y genera gran expectativa sobre el futuro.