OmniHuman-1

OmniHuman-1 是一种基于单张人像和运动信号生成人类视频的多模态框架。

普通产品视频视频生成多模态
OmniHuman-1 是一个端到端的多模态条件人类视频生成框架,能够基于单张人像和运动信号(如音频、视频或其组合)生成人类视频。该技术通过混合训练策略克服了高质量数据稀缺的问题,支持任意宽高比的图像输入,生成逼真的人类视频。它在弱信号输入(尤其是音频)方面表现出色,适用于多种场景,如虚拟主播、视频制作等。
打开网站

OmniHuman-1 替代品