Fashion-VDMは、バーチャル試着ビデオを生成するためのビデオ拡散モデル(VDM)です。このモデルは、衣服の画像と人物のビデオを入力として受け取り、指定された衣服を着た人物の高品質な試着ビデオを生成することを目的としています。同時に、人物のアイデンティティと動作を維持します。従来の画像ベースのバーチャル試着と比較して、Fashion-VDMは、衣服のディテールと時間的一貫性において優れた性能を発揮します。この技術の主な利点としては、拡散型アーキテクチャ、分類器フリーガイドによる制御強化、1回で64フレーム512pxビデオ生成の漸進的時系列トレーニング戦略、および画像とビデオの統合トレーニングの有効性などが挙げられます。Fashion-VDMは、ビデオバーチャル試着分野における新たな業界標準を確立しました。