गूगल ने रोबोट नियंत्रण मॉडल जेमिनी रोबोटिक्स लॉन्च किया, जो रोबोट को इंसानों की तरह सोचने और काम करने में सक्षम बनाता है

गूगल डीपमाइंड ने अपना गुप्त हथियार पेश किया है—जेमिनी रोबोटिक्स! यह आपके घर के साधारण रोबोट से बहुत अलग है, यह कृत्रिम बुद्धिमत्ता को वास्तविक लोहे के शरीर में डालने का प्रयास है, ताकि रोबोट भी हमारी तरह (या इससे भी अधिक चतुराई से) भौतिक दुनिया में अपना काम कर सकें।

सर्वशक्तिमान "बहुमुखी प्रतिभा"

जेमिनी रोबोटिक्स का मूल उन्नत जेमिनी 2.0 मॉडल पर आधारित है। ध्यान रखें, जेमिनी में स्वयं ही पाठ, चित्र, ऑडियो और वीडियो को संसाधित करने की शक्तिशाली क्षमता है।

और जेमिनी रोबोटिक्स एक कदम आगे बढ़ता है, जिससे रोबोट को भौतिक स्थान को समझने और कार्य करने की "अलौकिक" क्षमता मिलती है। इसका मतलब है कि चाहे वह लिखित निर्देशों का जवाब दे रहा हो, सामने की तस्वीर को पहचान रहा हो, आपकी आवाज को समझ रहा हो, या किसी ऑपरेशन वीडियो का विश्लेषण कर रहा हो, जेमिनी रोबोटिक्स सब कुछ समझ लेता है और उसे वास्तविक भौतिक कार्यों में बदल देता है।

सोचिए, भविष्य में आपको बस अपनी जुबान चलाना होगा, या रोबोट को एक तस्वीर दिखानी होगी, और वह आपके घर के कामों को बखूबी संभाल लेगा, थोड़ा उत्साहित तो हो ही रहे होंगे?

जेमिनी रोबोटिक्स की सबसे आकर्षक बात इसकी सामान्यीकरण क्षमता है। यह कोई पूर्व निर्धारित कार्यक्रम चलाने वाला "मूर्ख" नहीं है, इसमें जेमिनी का व्यापक विश्व ज्ञान है, भले ही वह नए वस्तुओं, विभिन्न प्रकार के निर्देशों या पहले कभी न देखे गए वातावरण का सामना कर रहा हो, यह तुरंत समझ लेता है और समाधान ढूंढ लेता है।

गूगल ने गर्व से कहा कि समग्र सामान्यीकरण बेंचमार्क परीक्षण में, जेमिनी रोबोटिक्स का प्रदर्शन अन्य शीर्ष दृश्य-भाषा-क्रिया मॉडलों से दोगुना से अधिक है। यह एक ऐसे विद्वान की तरह है जो न केवल परीक्षा में आसानी से पास हो जाता है, बल्कि विभिन्न प्रकार की व्यावहारिक समस्याओं को भी हल कर सकता है। भविष्य में आपातकालीन स्थितियों में, आपको रोबोट के "ऑफ़लाइन" होने की चिंता करने की ज़रूरत नहीं होगी!

"आपके मन की बात समझने वाला" मददगार सहायक

मानव-मशीन संपर्क के मामले में, जेमिनी रोबोटिक्स ने अद्भुत संवादात्मकता दिखाई है। यह न केवल रोज़मर्रा की बोलचाल की भाषा में दिए गए निर्देशों को समझ सकता है, बल्कि निर्देशों में अचानक बदलाव या आसपास के परिवेश में बदलाव के प्रति भी तुरंत प्रतिक्रिया दे सकता है।

और भी बेहतर यह है कि प्रारंभिक निर्देश प्राप्त करने के बाद, इसे अधिक हस्तक्षेप की आवश्यकता के बिना स्वतंत्र रूप से कार्य पूरा कर सकता है। कल्पना कीजिए कि आप आराम से कॉफी पी रहे हैं, और आप कह देते हैं, "मेज़ साफ़ कर दो", जेमिनी रोबोटिक्स तुरंत समझ जाएगा और संभावित छोटी-छोटी दुर्घटनाओं, जैसे कि गलती से पानी का गिलास गिर जाने पर, वह तुरंत अपनी हरकतों को बदल लेगा।।

जेमिनी रोबोटिक्स की "बुद्धिमत्ता" बहुत अधिक है, लेकिन इसका "भावनात्मक बुद्धिमत्ता"—यानी लचीलापन भी उतना ही अच्छा है। कई सूक्ष्म क्रियाएँ जो हम मनुष्य आसानी से कर लेते हैं, पारंपरिक रोबोटों के लिए अक्सर बहुत बड़ी चुनौती होती हैं।

लेकिन जेमिनी रोबोटिक्स आसानी से इसका सामना कर सकता है, चाहे वह कागज़ मोड़ना हो, लंच पैक करना हो या एक उत्तम सलाद बनाना हो, यह सूक्ष्म क्रियाएँ और सटीक समन्वय दिखा सकता है। भविष्य में यदि आप प्यार से बना हुआ लंच खाना चाहेंगे, तो शायद आपको जेमिनी रोबोटिक्स को केवल एक साधारण रेसिपी देना होगा।

"बहुरूपी" अनुकूलनशीलता

और भी आश्चर्यजनक बात यह है कि जेमिनी रोबोटिक्स में बहु-रूप अनुकूलनशीलता है। यह केवल किसी एक विशेष रोबोट आकार के लिए उपयुक्त नहीं है, चाहे वह दो-हथियार वाला रोबोट प्लेटफ़ॉर्म ALOHA2 हो या मानवरूपी रोबोट Apptronik का Apollo हो, जेमिनी रोबोटिक्स आसानी से इसे संभाल सकता है। इसका मतलब है कि भविष्य में हम विभिन्न प्रकार के स्मार्ट रोबोट देख सकते हैं जो जेमिनी रोबोटिक्स से लैस हैं और विभिन्न क्षेत्रों में अपनी अनूठी भूमिका निभाते हैं।

"सर्व-क्षमता वाले" खिलाड़ी जेमिनी रोबोटिक्स के अलावा, गूगल ने जेमिनी रोबोटिक्स-ER भी पेश किया है। यहाँ "ER" का अर्थ है "सन्निहित तर्क" (Embodied Reasoning)।

यह मॉडल रोबोट की भौतिक दुनिया की स्थानिक समझ को बढ़ाने पर अधिक ध्यान केंद्रित करता है, और मौजूदा निम्न-स्तरीय नियंत्रकों के साथ एकीकृत किया जा सकता है। यह वस्तु पहचान और 3D पहचान जैसे पहलुओं में जेमिनी 2.0 की क्षमताओं को काफी बढ़ा सकता है।

स्थानिक तर्क और जेमिनी की कोडिंग क्षमता को मिलाकर, जेमिनी रोबोटिक्स-ER रोबोट के लिए नए कार्य भी "तुरंत" बना सकता है। उदाहरण के लिए, जब यह एक कॉफी कप देखता है, तो यह स्वचालित रूप से सबसे उपयुक्त पकड़ने के तरीके और सुरक्षित आंदोलन पथ का निर्णय ले सकता है।

निश्चित रूप से, जब कृत्रिम बुद्धिमत्ता को वास्तविक दुनिया में लाया जाता है, तो सुरक्षा एक महत्वपूर्ण मुद्दा है। गूगल ने जोर देकर कहा कि उन्होंने व्यापक सुरक्षा उपाय किए हैं, मोटर नियंत्रण से लेकर उच्च-स्तरीय अर्थपूर्ण समझ तक, हर पहलू पर सावधानीपूर्वक विचार किया गया है।

जेमिनी रोबोटिक्स-ER रोबोट के मौजूदा सुरक्षा नियंत्रकों के साथ बातचीत कर सकता है, संभावित कार्यों की सुरक्षा का आकलन कर सकता है और उपयुक्त प्रतिक्रियाएँ उत्पन्न कर सकता है। इसके अलावा, गूगल ने एक नया डेटासेट ASIMOV भी जारी किया है ताकि सन्निहित कृत्रिम बुद्धिमत्ता और रोबोटों की अर्थपूर्ण सुरक्षा का मूल्यांकन और सुधार किया जा सके। वे आंतरिक और बाहरी विशेषज्ञों, नीति निर्माताओं और जिम्मेदारी और सुरक्षा समितियों के साथ मिलकर काम कर रहे हैं ताकि यह सुनिश्चित किया जा सके कि जेमिनी रोबोटिक्स का विकास नैतिक और सुरक्षा मानकों के अनुरूप है।

जेमिनी रोबोटिक्स के व्यावहारिक अनुप्रयोगों को तेज करने के लिए, गूगल ने कई रोबोट कंपनियों के साथ सहयोग किया है, जिनमें Apptronik, Agile Robots, Agility Robotics, Boston Dynamics और Enchanted Tools शामिल हैं। इन उद्योग के अग्रदूतों के साथ सहयोग से, हम निकट भविष्य में हमारे जीवन और कार्य में जेमिनी रोबोटिक्स से लैस अधिक स्मार्ट रोबोट देखने की उम्मीद कर सकते हैं।

गूगल का जेमिनी रोबोटिक्स निस्संदेह कृत्रिम बुद्धिमत्ता और रोबोटिक्स के क्षेत्र में नई ऊर्जा का संचार करता है। इसकी शक्तिशाली बहु-मोडल समझ क्षमता, उत्कृष्ट सामान्यीकरण, प्राकृतिक मानव-मशीन संपर्क और उत्कृष्ट परिचालन कौशल, एक बुद्धिमान रोबोट युग के आगमन का संकेत देते हैं। यह "कार्यकर्ताओं के लिए वरदान" है या कुछ "छोटी-छोटी" व्यावसायिक चुनौतियाँ लाएगा, यह देखने वाली बात है! आखिरकार, कौन एक स्मार्ट और मेहनती रोबोट सहायक नहीं चाहता?

आधिकारिक ब्लॉग: https://deepmind.google/discover/blog/gemini-robotics-brings-ai-into-the-physical-world/

AI समाचार

AIbase基地

सर्वशक्तिमान "बहुमुखी प्रतिभा"

"आपके मन की बात समझने वाला" मददगार सहायक

"बहुरूपी" अनुकूलनशीलता

संबंधित AI समाचार अनुशंसाएँ

AI रोबोट कंपनी डेक्सटेरिटी ने 9.5 करोड़ डॉलर का निवेश जुटाया, वैल्यूएशन 16.5 अरब डॉलर

फ्लोरा ने रचनात्मक पेशेवरों के लिए AI-संचालित अनंत कैनवास उपकरण लॉन्च किया

Hugging Face ने 'Pi-Zero' लॉन्च किया, AI रोबोट बनाना और तैनात करना आसान

LG इलेक्ट्रॉनिक्स ने AI ह्यूमनॉइड रोबोट विकसित किया, सब्सक्रिप्शन मॉडल भविष्य के घरेलू उपयोग का मार्गदर्शक होगा