हाल ही में, तकनीकी विश्लेषण एजेंसी SemiAnalysis ने एक पांच महीने की जांच रिपोर्ट जारी की, जिसमें AMD के नवीनतम MI300X AI चिप के सॉफ़्टवेयर में महत्वपूर्ण समस्याएँ सामने आई हैं, जिसके कारण यह अपनी अपेक्षित प्रदर्शन क्षमता को नहीं दिखा पा रहा है, और इस प्रकार AI चिप बाजार में Nvidia की प्रमुखता को चुनौती नहीं दे पा रहा है।

चिप प्रौद्योगिकी (1)

चित्र स्रोत नोट: चित्र AI द्वारा उत्पन्न, चित्र अधिकार सेवा प्रदाता Midjourney

रिपोर्ट में बताया गया है कि AMD के सॉफ़्टवेयर में कई बग हैं, जिसके कारण AI मॉडल प्रशिक्षण लगभग असंभव हो गया है, और उपयोगकर्ताओं को डिबगिंग में बहुत सारा समय बिताना पड़ता है। इस बीच, Nvidia लगातार नई सुविधाएँ, पुस्तकालय और प्रदर्शन अपडेट जारी कर रहा है, जिससे दोनों के बीच की खाई और बढ़ गई है। विश्लेषकों ने GEMM बेंचमार्क परीक्षण और एकल नोड प्रशिक्षण सहित कई परीक्षण किए, और परिणाम दर्शाते हैं कि AMD हमेशा所谓的 "CUDA किला" को पार नहीं कर सका - यानी Nvidia के सॉफ़्टवेयर में मजबूत लाभ।

हार्डवेयर स्पेसिफिकेशन के संदर्भ में, MI300X के प्रदर्शन आंकड़े काफी आकर्षक हैं, FP16 गणना क्षमता 1307TeraFLOPS तक पहुँचती है, जिसमें 192GB HBM3 मेमोरी शामिल है। जबकि Nvidia का H100 989TeraFLOPS और 80GB मेमोरी के साथ आता है, हालाँकि Nvidia का नवीनतम H200 मेमोरी के संदर्भ में इस अंतर को कम कर रहा है, जो 141GB की सेटिंग प्रदान करता है। उल्लेखनीय है कि AMD प्रणाली कुल स्वामित्व लागत के संदर्भ में फायदेमंद है, इसकी कीमत कम है और ईथरनेट नेटवर्क अधिक किफायती है।

हालांकि, ये हार्डवेयर लाभ वास्तविक उपयोग में अपेक्षित प्रभाव नहीं डाल पाए हैं। SemiAnalysis ने इस स्थिति को "केवल पिक्सेल की संख्या के आधार पर कैमरे की तुलना" करने के रूप में वर्णित किया, यह सुझाव देते हुए कि AMD डिजिटल खेल में खो गया है और पर्याप्त वास्तविक प्रदर्शन प्रदान नहीं कर पाया है। उपयोगी बेंचमार्क परिणाम प्राप्त करने के लिए, विश्लेषकों को AMD इंजीनियरों के साथ सीधे सहयोग करना पड़ा, जिन्होंने कई सॉफ़्टवेयर बग को हल किया, जबकि Nvidia की प्रणाली को सीधे उपयोग किया जा सकता है, बिना अतिरिक्त समायोजन के।

रिपोर्ट में यह भी उल्लेख किया गया है कि AMD का सबसे बड़ा GPU क्लाउड सेवा प्रदाता Tensorwave को AMD टीम को अपने द्वारा खरीदे गए GPU मुफ्त में प्रदान करने के लिए मजबूर होना पड़ा, ताकि सॉफ़्टवेयर समस्याओं को हल किया जा सके। इस कारण से, SemiAnalysis ने सुझाव दिया कि AMD के CEO सु ज़िफेंग को सॉफ़्टवेयर विकास और परीक्षण में निवेश बढ़ाना चाहिए, विशेष रूप से MI300X चिप्स को स्वचालित परीक्षण के लिए आवंटित करना चाहिए, जटिल पर्यावरणीय चर को सरल बनाना चाहिए, और डिफ़ॉल्ट सेटिंग्स में सुधार करना चाहिए, ताकि फ़ैक्टरी अनुभव को बेहतर बनाया जा सके।

हालांकि SemiAnalysis चाहता है कि AMD Nvidia का एक मजबूत प्रतिस्पर्धी बने, लेकिन उन्होंने यह भी कहा कि "दुर्भाग्य से अभी भी बहुत काम करना बाकी है।" यदि सॉफ़्टवेयर में महत्वपूर्ण सुधार नहीं किया गया, तो AMD को आगे और पीछे हटने का खतरा होगा, विशेष रूप से Nvidia के अगले पीढ़ी के Blackwell चिप को लॉन्च करने की तैयारी के मामले में, हालाँकि कुछ रिपोर्टों में यह भी कहा गया है कि Nvidia के अगले पीढ़ी के उत्पादों का लॉन्च भी आसान नहीं होगा।

मुख्य बिंदु:

🌟 AMD MI300X AI चिप गंभीर सॉफ़्टवेयर समस्याओं का सामना कर रही है, जिसके कारण AI मॉडल प्रशिक्षण कठिन हो गया है।  

🔧 Nvidia अपनी मजबूत CUDA प्लेटफ़ॉर्म के माध्यम से बाजार में अपनी स्थिति का विस्तार कर रहा है, सॉफ़्टवेयर अपडेट बार-बार हो रहे हैं।  

💡 SemiAnalysis ने AMD से सॉफ़्टवेयर विकास में निवेश बढ़ाने और उपयोगकर्ता अनुभव को सुधारने की सिफारिश की है ताकि प्रतिस्पर्धा में वृद्धि हो सके।