हाल ही में, Waymo कंपनी ने "एंड-टू-एंड मल्टीमॉडल ऑटोनॉमस ड्राइविंग मॉडल" (EMMA) नामक एक AI अनुसंधान मॉडल को आधिकारिक रूप से जारी किया। यह मॉडल विशेष रूप से ऑटोनॉमस ड्राइविंग तकनीक के लिए प्रशिक्षित और ट्यून किया गया है, जो Gemini के व्यापक ज्ञान का उपयोग करता है, और जटिल सड़क दृश्यों को बेहतर ढंग से समझने के लिए बनाया गया है। Waymo ने अपने जारी किए गए अनुसंधान पत्र में इस मॉडल की डिजाइन अवधारणा और तकनीकी लाभों का विस्तार से वर्णन किया है, और शुद्ध एंड-टू-एंड विधियों के लाभ और हानि पर चर्चा की है।

छवि स्रोत नोट: छवि AI द्वारा उत्पन्न की गई है, छवि अधिकार सेवा प्रदाता Midjourney

Waymo ने कहा कि EMMA मॉडल Gemini के आधार पर बनाया गया है, जो इसकी क्षमताओं का पूरा लाभ उठाता है, और ऑटोनॉमस ड्राइविंग के कार्यों पर ध्यान केंद्रित करता है, जैसे कि गति योजना और तीन-आयामी वस्तु पहचान। यह मॉडल कई महत्वपूर्ण ऑटोनॉमस ड्राइविंग कार्यों में अच्छी कार्य स्थानांतरण क्षमता प्रदर्शित करता है। Waymo ने यह बताया कि प्रत्येक कार्य के लिए अलग-अलग मॉडल को प्रशिक्षित करने की तुलना में, EMMA ने पथ भविष्यवाणी, वस्तु पहचान और सड़क मानचित्र समझने के क्षेत्रों में प्रदर्शन में महत्वपूर्ण सुधार किया है।

Waymo के अनुसंधान परिणाम दिखाते हैं कि EMMA का निर्माण भविष्य के अधिक核心 ऑटोनॉमस ड्राइविंग कार्यों के संयोजन के लिए एक आशाजनक अनुसंधान दिशा प्रदान करता है। Waymo के उपाध्यक्ष और अनुसंधान प्रमुख Drago Anguelov ने कहा: "EMMA ने ऑटोनॉमस ड्राइविंग क्षेत्र में मल्टीमॉडल मॉडल की शक्ति और महत्व को प्रदर्शित किया है, और हम यह जानने के लिए उत्सुक हैं कि मल्टीमॉडल विधियाँ और घटक कैसे एक अधिक सामान्य और अनुकूलनशील ड्राइविंग सिस्टम के निर्माण में मदद कर सकते हैं।"

कच्चे कैमरा इनपुट और पाठ डेटा को संसाधित करने की क्षमता के मामले में, EMMA भी अच्छा प्रदर्शन करता है। यह विभिन्न ड्राइविंग आउटपुट उत्पन्न कर सकता है, और एक एकीकृत भाषा स्थान स्थापित करके, Gemini के विश्व ज्ञान और तर्क क्षमता का पूरा लाभ उठाता है, निर्णय प्रक्रिया को बढ़ाता है और एंड-टू-एंड योजना की दक्षता में सुधार करता है।

Waymo ने जोर देकर कहा कि इस अनुसंधान का महत्व केवल ऑटोनॉमस वाहनों के अनुप्रयोगों तक सीमित नहीं है, बल्कि वास्तविक दुनिया के कार्यों में उन्नत AI तकनीकों को लागू करके, जटिल गतिशील वातावरण में AI की क्षमताओं का विस्तार करता है।

मुख्य बिंदु:

🚗 EMMA मॉडल ऑटोनॉमस ड्राइविंग के लिए विशेष रूप से प्रशिक्षित है, जटिल सड़क दृश्यों को समझने के लिए Gemini ज्ञान का उपयोग करता है।

📈 पारंपरिक मॉडलों की तुलना में, EMMA ने महत्वपूर्ण कार्यों पर अधिक कुशल प्रदर्शन प्रदर्शित किया है।

🌍 अनुसंधान परिणाम न केवल ऑटोनॉमस ड्राइविंग में लागू होते हैं, बल्कि गतिशील वातावरण में AI के अनुप्रयोग की संभावनाओं का विस्तार करते हैं।