8 अप्रैल, 2025 को, एनवीडिया (NVIDIA) ने अपने नवीनतम बड़े भाषा मॉडल (LLM) - Llama3.1Nemotron Ultra253B को लॉन्च करने की घोषणा की। यह मॉडल Meta के Llama-3.1-405B-Instruct पर आधारित है, जिसे अभिनव तंत्रिका वास्तुकला खोज (NAS) तकनीक के माध्यम से गहन रूप से अनुकूलित किया गया है, यह न केवल हाल ही में जारी किए गए Llama4 श्रृंखला के Behemoth और Maverick से प्रदर्शन में बेहतर है, बल्कि इसे Hugging Face प्लेटफ़ॉर्म पर ओपन-सोर्स के रूप में भी जारी किया गया है, जिससे AI समुदाय में व्यापक ध्यान आकर्षित हुआ है।
प्रदर्शन में सफलता: Llama4Behemoth और Maverick को पीछे छोड़ा
एनवीडिया द्वारा जारी की गई आधिकारिक जानकारी और सोशल मीडिया पर हालिया चर्चा के अनुसार, Llama3.1Nemotron Ultra253B ने कई महत्वपूर्ण बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन किया है। इस मॉडल में 253 अरब पैरामीटर हैं, Llama4Behemoth के 2 ट्रिलियन कुल पैरामीटर (288 अरब सक्रिय पैरामीटर) और Maverick के 17 अरब सक्रिय पैरामीटर की तुलना में, Nemotron Ultra ने दक्षता और प्रदर्शन के संतुलन में उल्लेखनीय सफलता हासिल की है।
हालांकि विशिष्ट बेंचमार्क डेटा अभी तक पूरी तरह से सार्वजनिक नहीं किया गया है, लेकिन Nemotron Ultra कथित तौर पर अनुमान लगाने की क्षमता, निर्देशों का पालन करने और सामान्य कार्यों को संसाधित करने में Llama4 श्रृंखला के प्रमुख मॉडल से आगे निकल गया है। यह एनवीडिया द्वारा मॉडल आर्किटेक्चर के अनुकूलन के लिए NAS तकनीक के उपयोग के कारण है, जिससे मेमोरी उपयोग और अनुमान में देरी में कमी आई है, साथ ही उच्च सटीकता भी बनी हुई है। इसके विपरीत, Llama4Behemoth में भारी मात्रा में पैरामीटर होने के बावजूद, कंप्यूटिंग संसाधनों की अधिक आवश्यकता होती है, जबकि Nemotron Ultra एकल नोड 8x H100GPU पर कुशलतापूर्वक चल सकता है, जो इसकी व्यावहारिकता में इसकी ताकत दिखाता है।
ओपन-सोर्स रिलीज़: Hugging Face पर व्यावसायिक रूप से अनुकूल मॉडल
Llama3.1Nemotron Ultra253B न केवल प्रदर्शन में शक्तिशाली है, बल्कि इसकी ओपन-सोर्स रणनीति भी प्रशंसा के योग्य है। यह मॉडल Hugging Face प्लेटफ़ॉर्म पर खुले वज़न के साथ उपलब्ध है, जो NVIDIA ओपन मॉडल लाइसेंस और Llama3.1 समुदाय लाइसेंस समझौते का पालन करता है, और व्यावसायिक उपयोग का समर्थन करता है।
कहा जाता है कि Nemotron Ultra253B ने न केवल Llama4Behemoth और Maverick को पीछे छोड़ा है, बल्कि DeepSeek R1 के बराबर भी है, और इसमें व्यावसायिक लाइसेंस भी है, यह बहुत ही लोकप्रिय है!" इस कदम को एनवीडिया द्वारा AI लोकतंत्रीकरण को आगे बढ़ाने के एक महत्वपूर्ण कदम के रूप में माना जाता है, जो डेवलपर्स, उद्यमों और शोधकर्ताओं को उच्च-प्रदर्शन मॉडल तक आसान पहुँच प्रदान करता है।
इसके अलावा, यह मॉडल 128K तक के संदर्भ लंबाई का समर्थन करता है, जो उन्नत अनुमान, चैट इंटरैक्शन, पुनर्प्राप्ति-वर्धित पीढ़ी (RAG) और उपकरण कॉल जैसे कई कार्यों के लिए उपयुक्त है। एनवीडिया ने विशेष रूप से इस बात पर जोर दिया है कि डेवलपर्स सिस्टम संकेतों के माध्यम से "अनुमान मोड" (Reasoning On/Off) को स्विच कर सकते हैं, विभिन्न अनुप्रयोग परिदृश्यों की आवश्यकताओं को लचीले ढंग से पूरा कर सकते हैं।
यह ध्यान देने योग्य है कि Llama4Behemoth अभी तक पूरी तरह से जारी नहीं किया गया है (वर्तमान में यह प्रशिक्षण के चरण में है), इसलिए सीधी तुलना पूरी तरह से संभव नहीं हो सकती है। फिर भी, Nemotron Ultra अपने ओपन-सोर्स स्वभाव और सिंगल GPU क्लस्टर के लिए उच्च कुशलता के साथ, वर्तमान AI क्षेत्र में एक अग्रणी के रूप में देखा जा रहा है।
एनवीडिया की रणनीतिक तैनाती
उद्योग के विशेषज्ञों का विश्लेषण है कि Llama3.1Nemotron Ultra253B का प्रकाशन न केवल तकनीकी रूप से एक सफलता है, बल्कि AI पारिस्थितिकी तंत्र में एनवीडिया की रणनीतिक तैनाती भी है। मौजूदा ओपन-सोर्स मॉडल को अनुकूलित करके और उनके प्रदर्शन को बेहतर बनाकर, एनवीडिया ने न केवल AI सॉफ़्टवेयर विकास में अपनी क्षमता का प्रदर्शन किया है, बल्कि AI अनुमान और प्रशिक्षण में अपने हार्डवेयर (विशेष रूप से H100GPU) की मुख्य स्थिति को और मजबूत किया है। इस मॉडल की दक्षता का लाभ यह है कि कंपनियां कम लागत पर उच्च-प्रदर्शन AI समाधानों को तैनात कर सकती हैं, जो निस्संदेह एनवीडिया हार्डवेयर की बाजार मांग को बढ़ावा देगा।
Llama3.1Nemotron Ultra253B का आगमन बड़े भाषा मॉडल के क्षेत्र में एनवीडिया की एक और महत्वपूर्ण प्रगति को दर्शाता है। Llama4Behemoth और Maverick से बेहतर प्रदर्शन, ओपन-सोर्स और व्यावसायिक रूप से अनुकूल सुविधाओं के साथ, इसे 2025 में AI क्षेत्र में एक प्रमुख आकर्षण बनाता है।
प्रोजेक्ट प्रवेश द्वार: https://top.aibase.com/tool/llama-3-1-nemotron-ultra-253b