2024 में AWS re:Invent सम्मेलन में, अमेज़न वेब सर्विसेज (AWS) ने Trainium2 चिप पर आधारित Amazon Elastic Compute Cloud (EC2) इंस्टेंस को उपयोगकर्ताओं के लिए आधिकारिक रूप से लॉन्च करने की घोषणा की। यह नया इंस्टेंस GPU आधारित पिछले EC2 इंस्टेंस की तुलना में मूल्य-प्रदर्शन में 30-40% सुधार प्रदान करता है। AWS के CEO मैट गमन ने कहा: "मुझे Trainium2 संचालित Amazon EC2 Trn2 इंस्टेंस की आधिकारिक रिलीज की घोषणा करते हुए खुशी हो रही है।"
Trn2 इंस्टेंस के अलावा, AWS ने Trn2UltraServers भी लॉन्च किए हैं और अगले पीढ़ी के Trainium3 AI चिप का प्रदर्शन किया है। Trn2 इंस्टेंस में 16 Trainium2 चिप्स होते हैं, जो 20.8 पेटाफ्लॉप्स तक की गणनात्मक क्षमता प्रदान करते हैं, और इसे बड़े भाषा मॉडल (LLM) के प्रशिक्षण और तैनाती के लिए डिज़ाइन किया गया है जिसमें अरबों पैरामीटर होते हैं।
Trn2UltraServers चार Trn2 सर्वरों को एक प्रणाली में जोड़ता है, जो 83.2 पेटाफ्लॉप्स तक की गणनात्मक क्षमता प्रदान करता है, जिससे उच्चतम स्केलेबिलिटी प्राप्त होती है। इन UltraServers में 64 इंटरकनेक्टेड Trainium2 चिप्स होते हैं, जो ग्राहकों की प्रशिक्षण और अनुमान के दौरान गणनात्मक क्षमता की आवश्यकताओं को पूरा करते हैं। AWS के कंप्यूटिंग और नेटवर्क के उपाध्यक्ष डेविड ब्राउन ने कहा: "Trainium2 इंस्टेंस और Trn2UltraServers का लॉन्च ग्राहकों को सबसे जटिल AI मॉडल को हल करने के लिए आवश्यक गणनात्मक क्षमता प्रदान करता है।"
AWS ने Anthropic कंपनी के साथ मिलकर Project Rainier नामक एक बड़े पैमाने पर AI कंप्यूटिंग क्लस्टर शुरू किया है, जिसमें लाखों Trainium2 चिप्स का उपयोग किया गया है। यह आधारभूत संरचना Anthropic के विकास का समर्थन करेगी, जिसमें Trainium2 हार्डवेयर पर चलाने के लिए उनके प्रमुख उत्पाद Claude का अनुकूलन शामिल है।
इसके अलावा, Databricks और Hugging Face भी AWS के साथ मिलकर Trainium की क्षमताओं का उपयोग कर रहे हैं ताकि उनके AI उत्पादों के प्रदर्शन और लागत दक्षता में सुधार किया जा सके। Databricks इन हार्डवेयर का उपयोग अपने Mosaic AI प्लेटफॉर्म को बढ़ाने के लिए करने की योजना बना रहा है, जबकि Hugging Face Trainium2 को अपने AI विकास और तैनाती उपकरणों में एकीकृत करेगा।
Trainium2 के अन्य ग्राहकों में Adobe, Poolside और Qualcomm शामिल हैं। गमन ने उल्लेख किया कि Adobe ने Trainium2 का उपयोग करते हुए Firefly अनुमान मॉडल के प्रारंभिक परीक्षण के बाद बहुत संतोषजनक परिणाम प्राप्त किए हैं, और बड़ी बचत की उम्मीद है। "Poolside को अन्य विकल्पों की तुलना में 40% की बचत की उम्मीद है," उन्होंने जोड़ा। "Qualcomm Trainium2 का उपयोग करके एक AI प्रणाली विकसित कर रहा है जो क्लाउड में प्रशिक्षण और एज पर तैनाती कर सके।"
इसके अलावा, AWS ने अपने Trainium3 चिप का पूर्वावलोकन किया है, जो 3 नैनोमीटर प्रोसेस तकनीक पर आधारित है। Trainium3 पर आधारित UltraServers 2025 के अंत तक लॉन्च होने की उम्मीद है, जो Trn2UltraServers की तुलना में चार गुना अधिक प्रदर्शन प्रदान करने के लिए डिज़ाइन किए गए हैं।
Trainium हार्डवेयर के उपयोग को अनुकूलित करने के लिए, AWS ने Neuron SDK भी लॉन्च किया है, जो एक सॉफ्टवेयर टूलकिट है, जो डेवलपर्स को Trainium चिप्स पर सर्वोत्तम प्रदर्शन प्राप्त करने के लिए मॉडल को अनुकूलित करने में मदद करता है। यह SDK JAX और PyTorch जैसे ढांचे का समर्थन करता है, जिससे ग्राहकों को न्यूनतम कोड संशोधन के साथ मौजूदा कार्यप्रवाह में सॉफ्टवेयर को एकीकृत करने की अनुमति मिलती है।
वर्तमान में, Trn2 इंस्टेंस अमेरिका के पूर्वी क्षेत्र (ओहायो) में उपलब्ध हैं, और भविष्य में अन्य क्षेत्रों में विस्तार किया जाएगा। UltraServers वर्तमान में पूर्वावलोकन चरण में हैं।
नोट:
🌟 AWS ने Trainium2 इंस्टेंस को पुराने GPU इंस्टेंस की तुलना में 30-40% प्रदर्शन में सुधार के साथ लॉन्च किया।
💡 Trn2UltraServers कई Trn2 सर्वरों को मिलाकर अधिक मजबूत गणनात्मक क्षमता प्रदान करते हैं, जो बड़े AI मॉडल की आवश्यकताओं को पूरा करते हैं।
🚀 AWS कई कंपनियों के साथ सहयोग कर रहा है, AI प्रौद्योगिकी के अनुप्रयोग को बढ़ावा देने के लिए, जिससे ग्राहकों को लागत और प्रदर्शन में लाभ मिलता है।