El framework EMO de Alibaba mejora el realismo, la naturalidad y la expresividad de la generación de videos de cabeza al centrarse en la conexión entre las señales de audio y los movimientos faciales. EMO admite la generación de canciones y audio de voz en diferentes idiomas, lo que permite que los avatares de los personajes tengan expresiones y dinámicas ricas. Además, EMO puede lograr la interacción entre diferentes personajes, lo que brinda más posibilidades a la generación de videos.