MOFA-Videoは、様々な制御信号を用いて単一の画像をアニメーション化できる方法です。疎から密への(S2D)モーション生成と、フローベースのモーション適応技術を採用することで、軌跡、キーポイントシーケンス、それらの組み合わせなど、様々なタイプの制御信号を効果的に用いて単一画像をアニメーション化できます。訓練段階では、疎なモーションサンプリングによって疎な制御信号を生成し、その後、事前に学習済みのSVDを用いてビデオを生成する様々なMOFA-Adaptersを訓練します。推論段階では、凍結されたSVDを共同で制御するために、様々なMOFA-Adaptersを組み合わせることができます。