डायनामिककंट्रोल एक ऐसा ढाँचा है जिसका उपयोग टेक्स्ट से इमेज डिफ्यूज़न मॉडल की नियंत्रण क्षमता को बढ़ाने के लिए किया जाता है। यह विभिन्न प्रकार के नियंत्रण संकेतों के गतिशील संयोजन के माध्यम से, विभिन्न संख्या और प्रकार की स्थितियों के अनुकूली चयन का समर्थन करता है, ताकि छवियों को अधिक विश्वसनीय और विस्तृत रूप से संश्लेषित किया जा सके। यह ढाँचा पहले डबल-लूप नियंत्रक का उपयोग करता है, जो पूर्व-प्रशिक्षित सशर्त जनरेटिव मॉडल और भेदभाव मॉडल का उपयोग करके, सभी इनपुट स्थितियों के लिए प्रारंभिक वास्तविक स्कोर रैंकिंग उत्पन्न करता है। फिर, एक कुशल स्थिति मूल्यांकनकर्ता के निर्माण के लिए बहु-मोडल बड़े भाषा मॉडल (MLLM) का उपयोग किया जाता है, जो स्थिति रैंकिंग को अनुकूलित करता है। डायनामिककंट्रोल MLLM और डिफ्यूज़न मॉडल को संयुक्त रूप से अनुकूलित करता है, बहु-सशर्त टेक्स्ट-टू-इमेज कार्यों को बढ़ावा देने के लिए MLLM की अनुमान क्षमता का उपयोग करता है, और अंत में, रैंक की गई स्थितियों को समानांतर बहु-नियंत्रण एडेप्टर में इनपुट किया जाता है, जो गतिशील दृश्य स्थितियों की विशेषता मानचित्रण सीखते हैं और उन्हें ControlNet को विनियमित करने के लिए एकीकृत करते हैं, जिससे जनरेट की गई छवियों पर नियंत्रण बढ़ता है।