阿里的EMO框架通过关注音频提示和面部动作之间的联系,增强了头部视频生成的真实度、自然度和表现力。EMO支持不同语言的歌曲和口语音频生成,可以让角色化身具有丰富的表情和动态。此外,EMO还能实现不同角色之间的联动,为视频生成带来更多可能性。