आर्टिफिशियल इंटेलिजेंस (AI), मशीन लर्निंग (ML) और उच्च प्रदर्शन कंप्यूटिंग (HPC) के विभिन्न उद्योगों में तेजी से विकास के साथ, AMD ने हाल ही में ROCm6.3 लॉन्च किया है, जो AMD Instinct GPU त्वरक के लिए डिज़ाइन किया गया एक ओपन-सोर्स प्लेटफ़ॉर्म है। इस प्लेटफ़ॉर्म का उद्देश्य डेवलपर्स को कंप्यूटिंग संसाधनों, मेमोरी प्रबंधन और सॉफ़्टवेयर अनुकूलन की आवश्यकताओं का सामना करने में मदद करना है, जिससे कार्यक्षमता में सुधार हो सके।

ROCm6.3 में कई उन्नत उपकरण और अनुकूलन सुविधाएँ शामिल हैं, जो प्रदर्शन और डेवलपर मित्रता के बीच संतुलन बनाने का प्रयास करती हैं। इसमें, SGLang भाषा समर्थन AI इनफेरेंस को अधिक कुशल बनाता है, जिससे जटिल मॉडलों को सुचारू रूप से निष्पादित किया जा सकता है। इसके अलावा, पुनः डिज़ाइन किया गया FlashAttention-2 AI प्रशिक्षण और इनफेरेंस प्रक्रियाओं में प्रदर्शन की बाधाओं को प्रभावी ढंग से हल करता है, जिससे चलने की गति में काफी सुधार होता है।

उच्च प्रदर्शन कंप्यूटिंग क्षेत्र में, ROCm6.3 ने मल्टी-नोड FFT समर्थन जोड़ा है, जो वितरित प्रणालियों में फास्ट फूरियर ट्रांसफॉर्म को अनुकूलित करता है, HPC कार्यप्रवाह की स्केलेबिलिटी को बढ़ाता है। कंप्यूटर विज़न कार्यों के लिए, उन्नत कंप्यूटर विज़न पुस्तकालय ने अनुकूलित एल्गोरिदम प्रदान किए हैं, जो वस्तु पहचान और छवि प्रसंस्करण के प्रदर्शन को बेहतर बनाते हैं। जबकि AMD Fortran कंपाइलर उपयोगकर्ताओं को पुराने कोडबेस को GPU त्वरक के साथ जोड़ने में मदद करता है, जिससे वैज्ञानिक कंप्यूटिंग अनुप्रयोगों के लिए सुविधाजनक मार्ग प्रदान होता है।

ROCm6.3 का डिज़ाइन आधुनिक कंप्यूटिंग आवश्यकताओं को पूरा करने पर केंद्रित है, और इसके अनुकूलन प्रभाव स्पष्ट हैं। उपयोगकर्ता फीडबैक दिखाता है कि FlashAttention-2 का परिचय Transformer मॉडल के प्रशिक्षण की दक्षता में लगभग 30% सुधार लाता है, जबकि मल्टी-नोड FFT समर्थन शोधकर्ताओं को बड़े पैमाने पर डेटा को संभालने में उत्कृष्ट प्रदर्शन करने की अनुमति देता है, जिससे गणना की लागत कम होती है।

इसके अलावा, उन्नत कंप्यूटर विज़न पुस्तकालय ने छवि पहचान कार्यों के इनफेरेंस समय को तेज करने में भी महत्वपूर्ण सफलता हासिल की है, जिसका अर्थ है विकास चक्र में कमी और अनुप्रयोग परिणामों की उच्च सटीकता। एक ओपन-सोर्स प्लेटफ़ॉर्म के रूप में, ROCm6.3 लगातार अपडेट हो सकता है, और समुदाय का योगदान इसे नई तकनीकों के साथ संगत बनाए रखने में मदद करेगा।

कई सुविधाओं और अनुकूलनों को एकीकृत करके, ROCm6.3 ने न केवल डेवलपर्स और संगठनों के लिए एक विश्वसनीय उपकरण सेट प्रदान किया है, बल्कि बदलती हुई कंप्यूटिंग आवश्यकताओं को भी पूरा किया है। इसका ओपन-सोर्स डिज़ाइन और समुदाय का समर्थन इसे AI, ML और HPC कार्यभार के लिए एक आदर्श विकल्प बनाता है।

लिंक: https://community.amd.com/t5/ai/unlocking-new-horizons-in-ai-and-hpc-with-the-release-of-amd/ba-p/726434

मुख्य बिंदु:  

🌟 ROCm6.3 AMD द्वारा AI, ML और HPC कार्यभार के लिए लॉन्च किया गया एक ओपन-सोर्स प्लेटफ़ॉर्म है, जो कई उन्नत उपकरण और अनुकूलन प्रदान करता है।  

🚀 FlashAttention-2 ने Transformer मॉडल की प्रशिक्षण दक्षता को बढ़ाया, जबकि मल्टी-नोड FFT समर्थन ने HPC कार्यप्रवाह की स्केलेबिलिटी को बढ़ाया।  

🖼️ उन्नत कंप्यूटर विज़न पुस्तकालय और AMD Fortran कंपाइलर डेवलपर्स को अधिक कुशल उपकरण प्रदान करते हैं, जिससे पुराने कोड के साथ GPU त्वरक का एकीकरण बढ़ता है।