MOFA-Video ist eine Methode zur Animation einzelner Bilder mithilfe verschiedener Steuersignale. Es nutzt spärliche-zu-dichte (S2D) Bewegungsgenerierung und flussbasierte Bewegungsanpassungstechniken, um einzelne Bilder effektiv mit verschiedenen Arten von Steuersignalen wie Trajektorien, Keypoint-Sequenzen und deren Kombinationen zu animieren. In der Trainingsphase werden durch spärliche Bewegungsabtastung spärliche Steuersignale generiert, und anschließend werden verschiedene MOFA-Adapter trainiert, um Videos über ein vorab trainiertes SVD zu generieren. In der Inferenzphase können verschiedene MOFA-Adapter kombiniert werden, um das eingefrorene SVD gemeinsam zu steuern.