हाल ही में, Waymo ने स्वचालित ड्राइविंग क्षेत्र में एक महत्वपूर्ण कदम आगे बढ़ाया है। यह कंपनी हमेशा से Google DeepMind के साथ अपने सहयोग को अपनी प्रतिस्पर्धात्मक लाभ मानती रही है, और अब वे Google के मल्टी-मोडल बड़े भाषा मॉडल Gemini का उपयोग अपने स्वचालित ड्राइविंग टैक्सी के प्रशिक्षण प्रभाव को बढ़ाने के लिए कर रहे हैं।
Waymo ने एक नई शोध पत्र प्रकाशित की है, जिसमें एक "एंड-टू-एंड मल्टी-मोडल मॉडल" EMMA का परिचय दिया गया है, जो संवेदक डेटा को संभालने में सक्षम है, जिससे स्वचालित ड्राइविंग वाहनों के भविष्य की यात्रा पथ उत्पन्न किए जा सकते हैं। इसका मतलब है कि Waymo के बिना चालक वाले वाहन अधिक बुद्धिमानी से यात्रा निर्णय ले सकते हैं और बाधाओं से प्रभावी रूप से बच सकते हैं।
इस नई तकनीक का महत्व केवल इसके नवाचार में नहीं है, बल्कि इसलिए भी कि यह वर्तमान में अधिकांश बड़े भाषा मॉडलों के अनुप्रयोग दायरे को बदल सकती है। Waymo चाहता है कि MLLM को अपने स्वचालित ड्राइविंग सिस्टम का "प्राथमिक नागरिक" माना जाए, जो यह दर्शाता है कि भविष्य की स्वचालित ड्राइविंग वर्तमान चैटबॉट्स या छवि जनरेटर से बहुत भिन्न हो सकती है।
इस शोध पत्र में, Waymo ने उल्लेख किया है कि पारंपरिक स्वचालित ड्राइविंग सिस्टम आमतौर पर विभिन्न कार्यों के लिए विशिष्ट "मॉड्यूल" विकसित करते हैं, जिसमें संवेदन, मानचित्रण, पूर्वानुमान और योजना आदि शामिल हैं। हालांकि इस विधि ने पिछले कुछ वर्षों में कुछ प्रगति की है, इसकी सीमाएं स्पष्ट हैं, विशेष रूप से नए जटिल वातावरण का सामना करते समय। Waymo का मानना है कि Gemini जैसे MLLM इन समस्याओं को हल कर सकते हैं, क्योंकि इनमें व्यापक "विश्व ज्ञान" होता है और ये "श्रृंखला सोच तर्क" कर सकते हैं, मानव तर्क को अनुकरण कर सकते हैं।
EMMA मॉडल को Waymo की स्वचालित ड्राइविंग टैक्सी को जटिल वातावरण में नेविगेट करने में मदद करने के लिए विकसित किया गया है। उदाहरण के लिए, जब जानवरों या सड़क निर्माण जैसी स्थितियों का सामना करना पड़ता है, तो EMMA बिना चालक वाले वाहनों को सबसे अच्छा यात्रा मार्ग खोजने में मदद कर सकता है। हालांकि, Waymo यह भी समझता है कि EMMA में कुछ सीमाएं हैं, जैसे कि वर्तमान में यह लेजर रडार या रडार से 3D संवेदक इनपुट को संभालने में असमर्थ है।
Waymo के इस क्षेत्र में अनुसंधान को और गहराई से आगे बढ़ाने की आवश्यकता है, लेकिन वे आशा करते हैं कि यह उपलब्धि वर्तमान समस्याओं का सामना करने के लिए अधिक अनुसंधान को प्रेरित कर सकेगी और स्वचालित ड्राइविंग तकनीक के विकास को आगे बढ़ा सकेगी।
मुख्य बिंदु:
🚗 Waymo Google के Gemini मॉडल का उपयोग करके नए स्वचालित ड्राइविंग टैक्सी प्रशिक्षण प्रणाली EMMA को विकसित कर रहा है, निर्णय लेने की क्षमता को बढ़ा रहा है।
🌍 EMMA मॉडल जटिल संवेदक डेटा को संभालने में सक्षम है, बिना चालक वाले वाहनों को बुद्धिमानी से बाधाओं से बचने में मदद करता है।
🔍 हालांकि EMMA में क्षमता है, Waymo मानता है कि इसके मौजूदा सीमाओं को पार करने के लिए आगे और अनुसंधान की आवश्यकता है।