MotionDirector ist eine Technik zur Anpassung von Text-zu-Video-Diffusionsmodellen, um Videos mit den gewünschten Bewegungen zu generieren. Sie verwendet eine Zwei-Pfad-LoRA-Architektur, um das Lernen von Aussehen und Bewegung zu entkoppeln, und entwickelt einen neuartigen zeitlichen Entzerrungsverlust, um den Einfluss des Aussehens auf das zeitliche Trainingsziel zu reduzieren. Diese Methode unterstützt verschiedene nachgelagerte Anwendungen, wie das Mischen des Aussehens und der Bewegung verschiedener Videos sowie das Animieren einzelner Bilder mit benutzerdefinierten Bewegungen.