W.A.L.T
W.A.L.Tは、変分拡散モデルに基づく実写ビデオ生成手法です。
一般製品ビデオ動画生成画像生成
W.A.L.Tは、Transformerに基づく実写ビデオ生成手法です。画像と動画を統一的な潜在空間に圧縮することで、クロスモーダルな学習と生成を実現します。ウィンドウアテンション機構を用いることで、メモリと学習効率を向上させています。複数の動画・画像生成ベンチマークにおいて、最先端の性能を達成しています。
W.A.L.T 最新のトラフィック状況
月間総訪問数
716
直帰率
62.62%
平均ページ/訪問
1.2
平均訪問時間
00:00:12