2025 के उपभोक्ता इलेक्ट्रॉनिक्स शो (CES) में, NVIDIA ने एक नया Cosmos प्लेटफ़ॉर्म पेश किया, जिसका उद्देश्य भौतिक कृत्रिम बुद्धिमत्ता (AI) सिस्टम के विकास को गति देना है, विशेष रूप से स्वायत्त ड्राइविंग वाहनों और रोबोटों के लिए। Cosmos प्लेटफ़ॉर्म में जनरेटिव वर्ल्ड फाउंडेशन मॉडल (WFM), वीडियो टैगिंग, सुरक्षा तंत्र और एक तेज़ डेटा प्रोसेसिंग पाइपलाइन शामिल है, जो डेवलपर्स को वास्तविक दुनिया के डेटा पर निर्भरता को कम करते हुए AI मॉडल बनाने और अनुकूलित करने में मदद करता है।
Cosmos प्लेटफ़ॉर्म को Hugging Face और NVIDIA NGC कैटलॉग में ओपन मॉडल लाइसेंस के रूप में उपलब्ध कराया जाएगा, इसके बाद NVIDIA NIM माइक्रोसर्विसेज़ का अनुकूलित संस्करण पेश किया जाएगा, और NVIDIA AI एंटरप्राइज सॉफ्टवेयर प्लेटफ़ॉर्म के माध्यम से व्यावसायिक समर्थन प्रदान किया जाएगा।
NVIDIA के सीईओ जेन-शु हुआंग ने शो में कहा: "रोबोटिक्स एक ऐसे मोड़ पर पहुंचने वाला है जैसे ChatGPT। बड़े भाषा मॉडल की तरह, वर्ल्ड फाउंडेशन मॉडल रोबोट और स्वायत्त ड्राइविंग वाहनों के विकास को आगे बढ़ाने का मूल है, लेकिन सभी डेवलपर्स के पास अपने मॉडल को प्रशिक्षित करने की क्षमता और संसाधन नहीं हैं। हमने Cosmos का निर्माण किया है ताकि भौतिक AI के विकास को और अधिक सुलभ बनाया जा सके, ताकि हर डेवलपर सामान्य रोबोटिक्स तकनीक तक पहुंच सके।"
Cosmos मॉडल टेक्स्ट, इमेज और सेंसर डेटा के आधार पर भौतिक वीडियो उत्पन्न कर सकता है, जिससे यह वीडियो खोज, सिंथेटिक डेटा जनरेशन और强化学习 जैसी अनुप्रयोगों के लिए उपयुक्त है। डेवलपर्स मॉडल को औद्योगिक वातावरण, ड्राइविंग परिदृश्यों और अन्य विशिष्ट उपयोग मामलों का अनुकरण करने के लिए अनुकूलित कर सकते हैं। इसके अलावा, NVIDIA ने NeMo Curator पेश किया है, जो एक तेज़ वीडियो प्रोसेसिंग पाइपलाइन है, जो 14 दिनों में 2000万 घंटे के वीडियो डेटा को प्रोसेस कर सकती है, और Cosmos Tokeniser, जो एक दृश्य डेटा संपीड़न उपकरण है।
Agility Robotics के मुख्य तकनीकी अधिकारी प्रास वेलगापुड़ी ने बताया: "डेटा की कमी और विविधता रोबोटिक वातावरण में सफलतापूर्वक सीखने की प्रमुख चुनौतियाँ हैं। Cosmos की टेक्स्ट, इमेज और वीडियो से वर्ल्ड बनाने की क्षमता हमें विभिन्न कार्यों के परिदृश्यों को उत्पन्न और बढ़ाने की अनुमति देती है, जिससे हमें बहुत महंगे वास्तविक डेटा कैप्चर की आवश्यकता के बिना मॉडल को प्रशिक्षित करने में मदद मिलती है।"
कई प्रमुख रोबोटिक्स और परिवहन कंपनियाँ, जैसे Agile Robots, XPENG, Waabi और Uber, पहले से ही AI विकास के लिए Cosmos का उपयोग करना शुरू कर चुकी हैं। Uber के सीईओ दारा खोस्रोशाही ने कहा: "जनरेटिव AI भविष्य की गतिशीलता को प्रेरित करेगा, इसके लिए समृद्ध डेटा और शक्तिशाली कंप्यूटिंग क्षमताओं की आवश्यकता है। NVIDIA के साथ सहयोग के माध्यम से, हमें विश्वास है कि हम सुरक्षित, स्केलेबल स्वायत्त ड्राइविंग समाधानों की प्रक्रिया को तेज करने में मदद कर सकते हैं।"
Cosmos के अलावा, NVIDIA ने Llama Nemotron बड़े भाषा मॉडल और Cosmos Nemotron दृश्य भाषा मॉडल भी पेश किए हैं, जो चिकित्सा, वित्त और निर्माण जैसे उद्योगों के लिए विशेष रूप से विकसित किए गए हैं।
आधिकारिक ब्लॉग: https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-world-foundation-model-platform-to-accelerate-physical-ai-development
मुख्य बिंदु:
🌍 Cosmos प्लेटफ़ॉर्म का उद्देश्य स्वायत्त ड्राइविंग वाहनों और रोबोटों के विकास को तेज़ करना है, वास्तविक डेटा पर निर्भरता को कम करना।
🚀 डेवलपर्स अपनी आवश्यकताओं के अनुसार मॉडल को अनुकूलित कर सकते हैं, विभिन्न अनुप्रयोगों के लिए वीडियो डेटा उत्पन्न कर सकते हैं।
🤖 कई रोबोटिक्स और परिवहन कंपनियाँ Cosmos का उपयोग कर रही हैं, AI तकनीक के वास्तविक अनुप्रयोग को तेज़ कर रही हैं।