रोबोटिक्स स्टार्टअप 1X Technologies ने एक नई जनरेटिव मॉडल विकसित की है, जो रोबोट सिस्टम के प्रशिक्षण की दक्षता को बढ़ा सकती है। कंपनी ने एक नए ब्लॉग पोस्ट में इस मॉडल की घोषणा की, जो रोबोटिक्स के एक महत्वपूर्ण चुनौती का समाधान करता है, अर्थात् "विश्व मॉडल (1X World Model)" सीखना, जो यह भविष्यवाणी कर सकता है कि दुनिया रोबोट के कार्यों के प्रति कैसे प्रतिक्रिया करेगी।
जब रोबोट समान प्रारंभिक छवि अनुक्रम से शुरू होता है, तो यह विश्व मॉडल विभिन्न कार्यों के प्रस्तावों के आधार पर कई भविष्य के दृश्य की कल्पना कर सकता है।
यह क्षमता इसे जटिल वस्तुओं के इंटरैक्शन की भविष्यवाणी करने में सक्षम बनाती है, जैसे ठोस वस्तुओं की गति, वस्तुओं के गिरने के प्रभाव, और परिवर्तनीय वस्तुओं (जैसे पर्दे, कपड़े) और जॉइंट वस्तुओं (जैसे दरवाजे, दराज) के साथ इंटरैक्शन।
मूल्यांकन एक सामान्य रोबोट बनाने में एक बहुत व्यावहारिक लेकिन अक्सर अनदेखी की जाने वाली चुनौती है। यदि एक रोबोट को 1000 अद्वितीय कार्यों को पूरा करने के लिए प्रशिक्षित किया गया है, तो यह तय करना मुश्किल है कि क्या एक नया मॉडल सभी 1000 कार्यों में सुधार करता है। पर्यावरण में छोटे बदलाव, जैसे पृष्ठभूमि और प्रकाश में बदलाव, पुराने प्रयोगात्मक परिणामों को संदर्भ मूल्य खो देते हैं, खासकर गतिशील घरेलू या कार्यालय वातावरण में, यह समस्या और भी गंभीर हो जाती है।
इस समस्या को दूर करने के लिए, 1X ने एक पूरी तरह से नई विधि अपनाई, जो वास्तविक सेंसर डेटा से सीखकर सीधे एक सिम्युलेटर बनाती है, ताकि 1X की रोबोट नीति का लाखों दृश्य में मूल्यांकन किया जा सके। यह सिम्युलेटर न केवल परीक्षण को दोहराने में सक्षम है, बल्कि वास्तविक दुनिया की जटिलताओं को भी पूरी तरह से समाहित करता है।
1X के प्रशिक्षण प्रक्रिया में, 1X ने घरेलू और कार्यालय में विभिन्न गतिशील कार्यों को करने वाले मानव रोबोट के बारे में हजारों घंटे का डेटा इकट्ठा किया। इस डेटा के माध्यम से, 1X का विश्व मॉडल अवलोकन और कार्य के आधार पर भविष्य के वीडियो की भविष्यवाणी कर सकता है।
विभिन्न कार्य निर्देशों के तहत, यह मॉडल विविध परिणाम उत्पन्न कर सकता है, जो वस्तुओं के इंटरैक्शन के प्रति इसकी मजबूत सिमुलेटिंग क्षमता को दर्शाता है। यहां तक कि जब विशेष कार्य प्रदान नहीं किया जाता है, तब भी यह मॉडल तर्कसंगत वीडियो उत्पन्न कर सकता है, जैसे ड्राइविंग के दौरान लोगों और बाधाओं की पहचान और उनसे बचना।
इसके अलावा, मॉडल लंबे समय तक चलने वाले कार्य वीडियो भी उत्पन्न कर सकता है, जैसे टी-शर्ट मोड़ना।
बेशक, 1X का मॉडल कुछ चुनौतियों का सामना करता है, जैसे कि वस्तुओं के इंटरैक्शन में वस्तुओं का आकार और रंग बनाए रखने में असमर्थता, या कुछ मामलों में वस्तुओं का गायब होना।
साथ ही, भौतिक नियमों की समझ में भी कुछ सीमाएँ हैं, जैसे कभी-कभी उत्पन्न वीडियो में वस्तुएं हवा में लटकती हैं।
इस क्षेत्र में अनुसंधान को आगे बढ़ाने के लिए, 1X ने 100 घंटे से अधिक के वेक्टर क्वांटाइजेशन वीडियो और पूर्व-प्रशिक्षित बुनियादी मॉडल जारी किए हैं, और 1X विश्व मॉडल चैलेंज का आयोजन किया है, जिसमें कई चरण और नकद पुरस्कार शामिल हैं, जिसका उद्देश्य अधिक शोध को बढ़ावा देना है।
मुख्य बिंदु:
🌟 विश्व मॉडल एक आभासी सिम्युलेटर है जो रोबोट के व्यवहार और पर्यावरण के इंटरैक्शन की भविष्यवाणी कर सकता है।
🤖 वास्तविक डेटा से सीखकर, मॉडल लाखों दृश्य में मूल्यांकन करने में सक्षम है, जिससे रोबोट की बुद्धिमत्ता में सुधार होता है।
💰 अनुसंधान को बढ़ावा देने के लिए, 1X विश्व मॉडल चैलेंज का आयोजन किया गया है और पुरस्कार प्रोत्साहन प्रदान किया गया है।