FLATTEN
一貫性のあるテキストから動画への編集のためのオプティカルフロー誘導型アテンション
一般製品画像テキストから動画への編集オプティカルフロー
FLATTENは、テキストから動画への編集における一貫性問題を解決するための、オプティカルフロー誘導型アテンションプラグインです。拡散モデルのU-Netにオプティカルフローを導入することで、異なるフレーム上の同じオプティカルフローパス上のパッチがアテンションモジュール内で互いに注目するように強制することで、編集動画の視覚的一貫性を向上させます。さらに、FLATTENは訓練不要で、拡散ベースのテキストから動画への編集方法にシームレスに統合し、視覚的一貫性を向上させることができます。実験結果によると、提案手法は既存のテキストから動画への編集ベンチマークにおいて最先端の性能を達成しました。特に、編集動画の視覚的一貫性を維持する点で優れた性能を発揮します。
FLATTEN 最新のトラフィック状況
月間総訪問数
37
直帰率
41.38%
平均ページ/訪問
1.0
平均訪問時間
00:00:00