हाल के वर्षों में, कृत्रिम बुद्धिमत्ता और कंप्यूटर दृष्टि प्रौद्योगिकियों के तेजी से विकास के साथ, मनुष्यों और कंप्यूटरों के बीच इंटरएक्शन越来越 जीवंत और अभिव्यक्तिपूर्ण हो गया है। विशेष रूप से एनिमेशन निर्माण के क्षेत्र में, स्थैतिक चित्रों के आधार पर गतिशील वीडियो उत्पन्न करना हमेशा से अनुसंधान का केंद्र बिंदु रहा है।
हाल ही में, "DisPose" नामक एक नई तकनीक विकसित हुई है, जो स्थिति मार्गदर्शन को अलग करके, व्यक्तियों की छवि एनिमेशन प्रभाव को अधिक नियंत्रित बनाती है। सरल शब्दों में, DisPose इनपुट क्रिया वीडियो और संदर्भ व्यक्तियों को प्राप्त करता है, जिससे संदर्भ व्यक्ति वीडियो में क्रियाएँ कर सकता है।
DisPose तकनीक का मूल इसके पारंपरिक बिखरे हुए स्थिति जानकारी के पुनर्निर्माण और उपयोग में है। पारंपरिक विधियाँ अक्सर बिखरे हुए कंकाल स्थिति मार्गदर्शन पर निर्भर करती हैं, जो गतिशील वीडियो उत्पन्न करते समय पर्याप्त नियंत्रण संकेत प्रदान नहीं कर पातीं, जिससे एनिमेशन प्रभाव ठीक नहीं होता। इस कमी को दूर करने के लिए, DisPose ने एक नई विधि प्रस्तुत की है, जो बिखरे हुए स्थिति जानकारी को गति क्षेत्र मार्गदर्शन और प्रमुख बिंदुओं के अनुरूप संबंधों में परिवर्तित करके अधिक विस्तृत गति उत्पन्न करने में सक्षम बनाती है।
विशेष रूप से, DisPose पहले कंकाल स्थिति की गणना करके बिखरे हुए गति क्षेत्र का निर्माण करता है, और संदर्भ चित्र के आधार पर एक घने गति क्षेत्र उत्पन्न करने की विधि प्रस्तुत करता है। यह विधि न केवल क्षेत्र स्तर पर गति संकेत प्रदान करती है, बल्कि बिखरे हुए स्थिति नियंत्रण की सामान्यता को भी बनाए रखती है। साथ ही, DisPose संदर्भ चित्र से स्थिति प्रमुख बिंदुओं के अनुरूप प्रसार विशेषताएँ निकालता है, और फिर बहु-स्केल बिंदुओं के अनुरूप संबंध की गणना करके, इन विशेषताओं को लक्ष्य स्थिति में भेजता है, जिससे उपस्थिति की स्थिरता बढ़ती है।
इस नवाचार तकनीक को मौजूदा मॉडल में सुचारू रूप से एकीकृत करने के लिए, शोधकर्ताओं ने एक प्लगइन-शैली का मिश्रित ControlNet आर्किटेक्चर प्रस्तुत किया है। यह आर्किटेक्चर मौजूदा मॉडल के पैरामीटर को बदले बिना वीडियो उत्पन्न करने की गुणवत्ता और स्थिरता में सुधार करता है। व्यापक गुणात्मक और मात्रात्मक प्रयोगों के माध्यम से, DisPose वर्तमान तकनीकों की तुलना में महत्वपूर्ण लाभ दिखाता है, जो एनिमेशन निर्माण तकनीक के भविष्य के विकास की दिशा को संकेत करता है।
DisPose स्थिति जानकारी के उपयोग के तरीके को अनुकूलित करके, चित्र एनिमेशन की अभिव्यक्ति और नियंत्रण को बढ़ाता है। यह प्रगति न केवल शैक्षणिक अनुसंधान में महत्वपूर्ण है, बल्कि भविष्य की एनिमेशन उद्योग के लिए नई संभावनाएँ भी लाती है।
प्रोजेक्ट का प्रवेश द्वार: https://lihxxx.github.io/DisPose/
महत्वपूर्ण बिंदु:
📍 DisPose एक नई चित्र एनिमेशन तकनीक है, जो स्थिति मार्गदर्शन को अलग करके अधिक सटीक गतिशील उत्पन्न करती है।
🎨 यह तकनीक बिखरे हुए स्थिति जानकारी को गति क्षेत्र मार्गदर्शन और प्रमुख बिंदुओं के अनुरूप में परिवर्तित करती है, विस्तृत गति संकेत प्रदान करती है।
🔧 शोधकर्ताओं द्वारा प्रस्तुत मिश्रित ControlNet आर्किटेक्चर वीडियो उत्पन्न करने की गुणवत्ता और स्थिरता को प्रभावी ढंग से बढ़ा सकता है।