आज के तेजी से विकसित हो रहे आर्टिफिशियल इंटेलिजेंस (AI) के युग में, Etched नामक एक कंपनी सब कुछ दांव पर लगा रही है, एक AI आर्किटेक्चर जिसे Transformer कहा जाता है। हाल ही में, इस कंपनी ने Transformer के लिए विशेष रूप से डिज़ाइन किए गए पहले विशेषीकृत इंटीग्रेटेड सर्किट (ASIC) चिप - Sohu का अनावरण किया, और दावा किया कि इसकी प्रदर्शन वर्तमान में बाजार में उपलब्ध किसी भी GPU से कहीं अधिक है, जो AI क्षेत्र में क्रांतिकारी बदलाव लाएगा।
Transformer आर्किटेक्चर का AI क्षेत्र में प्रभुत्व
Etched कंपनी ने 2022 में एक साहसी भविष्यवाणी की: Transformer आर्किटेक्चर AI की दुनिया पर हावी होगा। यह साबित हुआ कि उनका आकलन सही था। आज, ChatGPT से लेकर Sora, Gemini से लेकर Stable Diffusion3 तक, हर अत्याधुनिक AI मॉडल ने Transformer आर्किटेक्चर को अपनाया है। इसी आकलन के आधार पर, Etched कंपनी ने Sohu चिप को विकसित करने में दो साल का समय बिताया।
Sohu चिप ने Transformer आर्किटेक्चर को सीधे हार्डवेयर में लागू करके अद्वितीय प्रदर्शन में सुधार किया है। हालांकि, इसका मतलब यह है कि Sohu अधिकांश पारंपरिक AI मॉडल, जैसे Instagram विज्ञापनों के पीछे DLRM, प्रोटीन फोल्डिंग मॉडल AlphaFold2 या पूर्व के इमेज मॉडल Stable Diffusion2 को नहीं चला सकता, लेकिन Transformer मॉडल के लिए, Sohu की गति किसी अन्य चिप से कहीं अधिक है।
प्रदर्शन में स्पष्ट लाभ
Etched कंपनी के अनुसार, 8 Sohu चिप्स वाले एक सर्वर Llama70B मॉडल चलाते समय प्रति सेकंड 500,000 से अधिक टोकन को संसाधित करने की अद्भुत गति प्राप्त कर सकता है। यह प्रदर्शन NVIDIA के आगामी Blackwell (B200) GPU से एक क्रम में तेज है, जबकि लागत कम है।
विशेष रूप से, एक 8xSohu सर्वर 160 H100 GPU को बदल सकता है। इसका मतलब है कि Sohu चिप्स का उपयोग AI मॉडल के संचालन की लागत को काफी कम कर सकता है, जबकि प्रक्रिया की गति को भी काफी बढ़ा सकता है।
दांव के पीछे की तर्कशक्ति
Etched कंपनी Transformer आर्किटेक्चर पर इस तरह से दांव लगाने के लिए दृढ़ है, क्योंकि वे AI विकास प्रवृत्तियों की गहरी अंतर्दृष्टि रखते हैं। कंपनी मानती है कि बड़े पैमाने पर संचालन ही मानव-स्तरीय बुद्धिमत्ता हासिल करने की कुंजी है। पिछले पांच वर्षों में, AI मॉडल अधिकांश मानकीकृत परीक्षणों में मानवों को पीछे छोड़ चुके हैं, और यह मुख्य रूप से कंप्यूटिंग शक्ति में भारी वृद्धि के कारण है। उदाहरण के लिए, Meta ने Llama400B मॉडल को प्रशिक्षित करते समय जो कंप्यूटिंग संसाधन उपयोग किया, वह OpenAI द्वारा GPT-2 के प्रशिक्षण के दौरान उपयोग किए गए संसाधनों से 50,000 गुना अधिक था।
हालांकि, पैमाने का विस्तार करना बहुत बड़ी चुनौतियों का सामना कर रहा है। अगली पीढ़ी के डेटा सेंटर की लागत एक छोटे देश के GDP से अधिक हो सकती है। वर्तमान विकास की गति के साथ, हमारा हार्डवेयर, ग्रिड और वित्तीय संसाधन इसके साथ तालमेल नहीं बिठा पा रहे हैं। यही Sohu चिप का अवसर है।
विशेषीकृत चिप की अनिवार्यता
Etched कंपनी मानती है कि जैसे-जैसे मूर के नियम में मंदी आ रही है, प्रदर्शन बढ़ाने का एकमात्र तरीका विशेषज्ञता है। Transformer आर्किटेक्चर के AI क्षेत्र में प्रभुत्व से पहले, कई कंपनियां विभिन्न आर्किटेक्चर का सामना करने के लिए लचीले AI चिप्स और GPU का विकास कर रही थीं। लेकिन अब, जब Transformer अनुमान की मांग लगभग 50 मिलियन डॉलर से बढ़कर अरबों डॉलर तक पहुंच गई है, और AI मॉडल आर्किटेक्चर में समानता आ गई है, विशेषीकृत चिप का उदय अनिवार्य हो गया है।
जब मॉडल के प्रशिक्षण की लागत 1 बिलियन डॉलर तक पहुंच जाती है, और अनुमान की लागत 10 बिलियन डॉलर से अधिक होती है, तो 1% प्रदर्शन में सुधार भी 50 से 100 मिलियन डॉलर की कस्टम चिप परियोजना को सार्थक साबित करने के लिए पर्याप्त होता है। और वास्तव में, ASIC का प्रदर्शन लाभ इससे कहीं अधिक है।
Sohu चिप का कार्यप्रणाली
Sohu चिप इतनी उच्च प्रदर्शन क्यों प्राप्त कर सकती है, इसका कारण यह है कि इसे Transformer आर्किटेक्चर के लिए विशेष रूप से अनुकूलित किया गया है। अधिकांश नियंत्रण प्रवाह तर्क को हटा कर, Sohu अधिक गणितीय संचालन इकाइयों को समायोजित कर सकता है। इससे Sohu का FLOPS उपयोग दर 90% से अधिक है, जबकि GPU पर TRT-LLM चलाते समय उपयोग दर केवल लगभग 30% होती है।
Etched कंपनी बताती है कि GPU का अधिकांश क्षेत्र प्रोग्रामेबिलिटी को सुनिश्चित करने के लिए उपयोग किया जाता है, जबकि Transformer के लिए विशेष रूप से डिज़ाइन किए गए चिप में अधिक गणना इकाइयाँ समायोजित की जा सकती हैं। वास्तव में, H100 GPU के 80 अरब ट्रांजिस्टर में से केवल 3.3% मैट्रिक्स गुणा के लिए उपयोग किया जाता है। जबकि Sohu Transformer पर ध्यान केंद्रित करके चिप पर अधिक FLOPS समायोजित कर सकता है, बिना सटीकता कम किए या स्पैर्सिटी तकनीक का उपयोग किए।
सॉफ्टवेयर पारिस्थितिकी तंत्र
हालांकि Sohu चिप ने हार्डवेयर स्तर पर महत्वपूर्ण प्रगति की है, सॉफ्टवेयर पारिस्थितिकी तंत्र भी अत्यंत महत्वपूर्ण है। GPU और TPU की तुलना में, Sohu का सॉफ्टवेयर विकास अपेक्षाकृत सरल है, क्योंकि इसे केवल Transformer आर्किटेक्चर का समर्थन करने की आवश्यकता है। Etched कंपनी ने ड्राइवर से लेकर कर्नेल तक और सेवा स्टैक तक सभी सॉफ्टवेयर को ओपन-सोर्स करने का वादा किया है, जिससे डेवलपर्स के लिए Sohu चिप का उपयोग और अनुकूलन करना बहुत आसान हो जाएगा।
भविष्य की दृष्टि
यदि Etched कंपनी का दांव सफल होता है, तो Sohu चिप AI उद्योग के परिदृश्य को पूरी तरह से बदल देगी। वर्तमान में, कई AI अनुप्रयोग प्रदर्शन बाधाओं का सामना कर रहे हैं। उदाहरण के लिए, Gemini को एक वीडियो से संबंधित प्रश्न का उत्तर देने में 60 सेकंड से अधिक समय लगता है, कोडिंग एजेंट की लागत सॉफ्टवेयर इंजीनियर से अधिक है और इसे पूरा करने में घंटों लगते हैं, वीडियो मॉडल प्रति सेकंड केवल एक फ्रेम उत्पन्न कर सकते हैं।
Sohu चिप AI मॉडल की गति को 20 गुना बढ़ाने की उम्मीद है, जबकि लागत को भी काफी कम कर देगी। इसका मतलब है कि रीयल-टाइम वीडियो उत्पादन, कॉल, स्मार्ट एजेंट और खोज जैसे अनुप्रयोग संभव हो जाएंगे। Etched कंपनी ने पहले उपयोगकर्ताओं के लिए Sohu डेवलपर क्लाउड सेवा के लिए आवेदन स्वीकार करना शुरू कर दिया है और सक्रिय रूप से अपनी टीम में प्रतिभाओं की भर्ती कर रही है।
AI कंप्यूटिंग क्षमता में यह突破 गहरा प्रभाव डाल सकता है, और Etched कंपनी की Sohu चिप निश्चित रूप से हमारे करीब से देखने लायक है। जैसे-जैसे अधिक विवरण प्रकट होंगे और वास्तविक अनुप्रयोगों का विकास होगा, हम इस तकनीक की क्षमता और AI क्षेत्र पर इसके प्रभाव का बेहतर आकलन कर सकेंगे।