मोशनडायरेक्टर एक ऐसी तकनीक है जो टेक्स्ट-टू-वीडियो डिफ्यूज़न मॉडल को कस्टमाइज़ करके वांछित एक्शन वाले वीडियो बना सकती है। यह ड्यूल-पैथ LoRAs आर्किटेक्चर का उपयोग करता है, जो दिखावे और गति के सीखने को अलग करता है, और एक नया डाइबाइस्ड टाइम लॉस डिज़ाइन करता है, जिससे दिखावे के समय प्रशिक्षण लक्ष्य पर प्रभाव कम होता है। यह विधि विभिन्न डाउनस्ट्रीम अनुप्रयोगों का समर्थन करती है, जैसे कि अलग-अलग वीडियो के दिखावे और गति को मिलाना, और एकल इमेज में कस्टम एक्शन के साथ एनीमेशन जोड़ना।