Snap Video
Snap视频:用于文本到视频合成的可扩展空间时间转换器
普通产品视频视频合成transformer
Snap视频是一个视频优先的模型,通过延伸EDM框架系统地解决视频生成域中的运动保真度、视觉质量和可扩展性等挑战。该模型利用帧间的冗余信息,提出了一个可伸缩的transformer架构,将空间和时间维度作为一个高度压缩的1D潜在向量,从而有效地进行空间时间联合建模,合成时间连贯性强、运动复杂的视频。这种架构使模型可以高效训练,达到数十亿参数规模,在多项基准测试中取得最优效果。
Snap Video 最新流量情况
月总访问量
11712
跳出率
53.79%
平均页面访问数
1.4
平均访问时长
00:00:22