在2024年世界人工智能大会(WAIC)上,商汤科技推出的可控人物视频生成大模型——Vimi。Vimi模型利用商汤先进的大模型技术,能够通过单张照片生成与目标动作一致的人物视频,实现精准的表情和肢体控制。该模型支持多种驱动方式,包括视频、动画、声音和文字,具有多年积累的面部跟踪技术和对细节的精确控制能力,能够生成高一致性、光影和谐的视频内容。

Vimi的稳定性尤为突出,能够生成长达1分钟以上的单镜头人物视频,且画面效果不会随时间劣化。它还能根据人物动作调整环境场景,模拟镜头角度变化和头发抖动,提供逼真的视觉效果。此外,Vimi还支持光影变化模拟,为视频创作者提供丰富的创作自由度。

微信截图_20240709140907.png

Vimi相机作为基于Vimi大模型的首款C端应用,主要面向广大女性用户,满足她们的娱乐创作需求。用户上传不同角度的高清人物图片后,Vimi相机能自动生成数字分身和不同风格的写真视频,提供多样化的生成风格。Vimi相机还支持通过单张图片生成趣味人物表情包,玩法多样,实现个性化创作。

目前,Vimi相机正开放内测,感兴趣的用户可以通过关注公众号并填写预约链接申请体验。