商汤科技推出Vimi视频生成大模型 C端应用Vimi相机开放内测

在2024年世界人工智能大会（WAIC）上，商汤科技推出的可控人物视频生成大模型——Vimi。Vimi模型利用商汤先进的大模型技术，能够通过单张照片生成与目标动作一致的人物视频，实现精准的表情和肢体控制。该模型支持多种驱动方式，包括视频、动画、声音和文字，具有多年积累的面部跟踪技术和对细节的精确控制能力，能够生成高一致性、光影和谐的视频内容。

Vimi的稳定性尤为突出，能够生成长达1分钟以上的单镜头人物视频，且画面效果不会随时间劣化。它还能根据人物动作调整环境场景，模拟镜头角度变化和头发抖动，提供逼真的视觉效果。此外，Vimi还支持光影变化模拟，为视频创作者提供丰富的创作自由度。

微信截图_20240709140907.png

Vimi相机作为基于Vimi大模型的首款C端应用，主要面向广大女性用户，满足她们的娱乐创作需求。用户上传不同角度的高清人物图片后，Vimi相机能自动生成数字分身和不同风格的写真视频，提供多样化的生成风格。Vimi相机还支持通过单张图片生成趣味人物表情包，玩法多样，实现个性化创作。

目前，Vimi相机正开放内测，感兴趣的用户可以通过关注公众号并填写预约链接申请体验。

AI新闻资讯

商汤科技推出Vimi视频生成大模型 C端应用Vimi相机开放内测

AIbase

相关AI新闻推荐