एनवीडिया के शोध दल ने हाल ही में रोबोट नियंत्रण के क्षेत्र में एक महत्वपूर्ण सफलता हासिल की है। उन्होंने जो न्यूरल नेटवर्क सिस्टम HOVER विकसित किया है, वह अत्यधिक संक्षिप्त पैरामीटर संख्या के साथ मानव-आकार के रोबोट का प्रभावी नियंत्रण करता है, और इसका प्रदर्शन विशेष रूप से डिज़ाइन किए गए नियंत्रण प्रणालियों से भी बेहतर है।

यह केवल 1500000 पैरामीटर की आवश्यकता वाला HOVER सिस्टम जटिल रोबोटिक मूवमेंट नियंत्रण को संभाल सकता है। इसके विपरीत, सामान्य बड़े भाषा मॉडल अक्सर हजारों अरब पैरामीटर की आवश्यकता होती है। यह आश्चर्यजनक पैरामीटर दक्षता प्रणाली के डिज़ाइन की बारीकी को दर्शाती है।

image.png

HOVER का प्रशिक्षण एनवीडिया के आइज़ैक सिमुलेशन वातावरण में किया गया, जो रोबोट की गतिविधियों को 10000 गुना तेज कर सकता है। एनवीडिया के शोधकर्ता जिम फैन ने बताया कि इसका मतलब है कि एक वर्ष का प्रशिक्षण वर्चुअल स्पेस में केवल एक GPU पर 50 मिनट में पूरा किया जा सकता है।

सिस्टम की एक बड़ी विशेषता इसकी उत्कृष्ट अनुकूलनशीलता है। इसे अतिरिक्त ट्यूनिंग की आवश्यकता नहीं होती और यह सीधे सिमुलेशन वातावरण से वास्तविक रोबोट पर स्थानांतरित हो सकता है, और विभिन्न इनपुट विधियों का समर्थन करता है: जैसे Apple Vision Pro जैसे XR उपकरणों के माध्यम से सिर और हाथ की गतिविधियों को ट्रैक करना, मूवमेंट कैप्चर या RGB कैमरा के माध्यम से पूरे शरीर के स्थान डेटा प्राप्त करना, बाह्य कंकाल के माध्यम से जोड़ों के कोण एकत्र करना, और यहां तक कि मानक गेम कंट्रोलर का उपयोग करके नियंत्रण करना।

और भी आश्चर्य की बात यह है कि HOVER हर नियंत्रण विधि में प्रदर्शन के मामले में उन प्रणालियों से बेहतर है जो विशेष रूप से एकल इनपुट विधि के लिए विकसित की गई हैं। मुख्य लेखक ताइरान हे का अनुमान है कि यह प्रणाली के संतुलन और सटीक शारीरिक नियंत्रण जैसे भौतिक अवधारणाओं की गहरी समझ से उत्पन्न हो सकता है, जिससे यह विभिन्न नियंत्रण विधियों के बीच ज्ञान हस्तांतरण करने में सक्षम होती है।

यह प्रणाली ओपन-सोर्स H2O & OmniH2O परियोजना पर आधारित है, जो किसी भी मानव-आकार के रोबोट को नियंत्रित कर सकती है जो आइज़ैक सिमुलेटर में चल सकता है। वर्तमान में, एनवीडिया ने GitHub पर उदाहरण और कोड सार्वजनिक किया है, जो रोबोट अनुसंधान और विकास के क्षेत्र में नई संभावनाएं लाता है।