Sora
大规模视频生成扩散模型
全球热门视频视频生成文本控制
Sora是一个基于大规模训练的文本控制视频生成扩散模型。它能够生成长达1分钟的高清视频,涵盖广泛的视觉数据类型和分辨率。Sora通过在视频和图像的压缩潜在空间中训练,将其分解为时空位置补丁,实现了可扩展的视频生成。Sora还展现出一些模拟物理世界和数字世界的能力,如三维一致性和交互,揭示了继续扩大视频生成模型规模来发展高能力模拟器的前景。
Sora 最新流量情况
月总访问量
551146617
跳出率
57.47%
平均页面访问数
2.2
平均访问时长
00:01:46