हांगकांग चाइनीज यूनिवर्सिटी और टेंसेंट ने एक नया तकनीकी ढांचा ControlMM पेश किया है जो पूरे शरीर की गतिविधियों के उत्पादन में एक नई सफलता लाता है। यह तकनीक पाठ, आवाज, संगीत आदि जैसे बहु-मोडल इनपुट का समर्थन करती है, जिससे सामग्री के अनुसार पूरे शरीर की गतिविधियाँ उत्पन्न की जा सकती हैं।

image.png

उत्पाद का लिंक: https://top.aibase.com/tool/controlmm

ControlMM का उद्देश्य वर्तमान में पाठ, आवाज या संगीत नियंत्रण में पूरे शरीर की बहु-मोडल गतिविधि उत्पन्न करने में मौजूद कई चुनौतियों को हल करना है। जैसे, विभिन्न उत्पन्न परिदृश्यों में गतिविधियों का वितरण भटकाव, मिश्रित स्थितियों के विभिन्न जटिल अनुकूलन, और मौजूदा डेटा सेट में असंगत गतिविधि प्रारूप आदि।

इन चुनौतियों का प्रभावी ढंग से सामना करने के लिए, शोधकर्ताओं ने कई नवाचारात्मक तरीकों का प्रस्ताव किया है। सबसे पहले, ControlMM-Attn का उपयोग स्थिर और गतिशील मानव शरीर के टोपोलॉजी को समानांतर मॉडलिंग के लिए किया गया है, ताकि विभिन्न गतिविधियों के वितरण में गतिविधि ज्ञान को प्रभावी ढंग से सीखा और संचारित किया जा सके।

दूसरे, ControlMM ने एक मोटे से बारीक प्रशिक्षण रणनीति अपनाई है, जिसमें चरण 1 में पाठ से गतिविधि पूर्व-प्रशिक्षण शामिल है और चरण 2 में विभिन्न निम्न-स्तरीय स्थितियों के लिए बहु-मोडल नियंत्रण का अनुकूलन शामिल है।

इसके अलावा, मौजूदा मानकों में गतिविधि प्रारूपों की असंगति को हल करने के लिए, ControlMM-Bench पेश किया गया है, जो एकीकृत पूरे शरीर के SMPL-X प्रारूप पर आधारित सार्वजनिक रूप से उपलब्ध बहु-मोडल पूरे शरीर की गतिविधि उत्पन्न करने का मानक है।

कई प्रयोगों के माध्यम से, ControlMM ने विभिन्न मानक गतिविधि उत्पन्न करने के कार्यों में उत्कृष्ट प्रदर्शन किया है। चाहे वह Text-to-Motion, Speech-to-Gesture या Music-to-Dance हो। बुनियादी मॉडल की तुलना में, ControlMM नियंत्रण, अनुक्रम और गतिविधि की तर्कसंगतता में महत्वपूर्ण लाभ प्रदान करता है।

ControlMM की प्रमुख विशेषताएँ:

1. ** बहु-मोडल नियंत्रण **: ControlMM पाठ, आवाज और संगीत जैसे कई मोड के माध्यम से पूरे शरीर की गतिविधि उत्पन्न करने का समर्थन करता है, जिससे नियंत्रण क्षमता और अनुकूलनशीलता बढ़ती है।

2. ** एकीकृत ढांचा **: एकीकृत ControlMM ढांचे का उपयोग करके विभिन्न गतिविधि उत्पन्न करने के कार्यों का एकीकरण किया गया है, जिससे उत्पादन की दक्षता में वृद्धि हुई है।

3. ** चरणबद्ध प्रशिक्षण रणनीति **: मोटे से बारीक प्रशिक्षण रणनीति के माध्यम से, पहले पाठ से गतिविधि के लिए पूर्व-प्रशिक्षण किया जाता है, फिर निम्न-स्तरीय नियंत्रण संकेतों के अनुकूलन के लिए।

4. ** प्रभावी गतिविधि ज्ञान अधिग्रहण **: ControlMM-Attn मॉड्यूल गतिशील और स्थिर मानव शरीर के टोपोलॉजी को समानांतर मॉडलिंग करके गतिविधि अनुक्रम के प्रतिनिधित्व को अनुकूलित करता है, जिससे गतिविधि उत्पन्न करने की सटीकता में वृद्धि होती है।

5. ** नया मानक प्रस्तुत **: ControlMM-Bench पेश किया गया है, जो एकीकृत SMPL-X प्रारूप पर आधारित पहला सार्वजनिक बहु-मोडल पूरे शरीर की गतिविधि उत्पन्न करने का मानक है, जो इस क्षेत्र के अनुसंधान और अनुप्रयोग को बढ़ावा देता है।

6. ** उत्कृष्ट उत्पन्न परिणाम **: विभिन्न मानक गतिविधि उत्पन्न करने के कार्यों में, ControlMM ने नियंत्रण, निरंतरता और गतिविधि की तर्कसंगतता सहित अग्रणी प्रदर्शन दिखाया है।