दुनिया की सबसे तेज़ एआई इन्फेरेंस सेवा का आगाज़! गति में 20 गुना वृद्धि, लागत बेहद कम

प्रदर्शन एआई कंप्यूटिंग क्षेत्र के अग्रदूत Cerebras Systems ने एक अभिनव समाधान पेश किया है, जो एआई अनुकरण को पूरी तरह से बदल देगा। 27 अगस्त 2024 को, कंपनी ने Cerebras Inference की घोषणा की, जो दुनिया की सबसे तेज़ एआई अनुकरण सेवा है। Cerebras Inference के प्रदर्शन मापदंड पारंपरिक GPU आधारित सिस्टम की तुलना में बहुत ही कम लागत पर 20 गुना गति प्रदान करते हैं, जिससे एआई कंप्यूटिंग के लिए एक नया मानक स्थापित होता है।

Cerebras Inference विशेष रूप से विभिन्न प्रकार के एआई मॉडलों को संभालने के लिए उपयुक्त है, विशेष रूप से तेजी से विकसित हो रहे "बड़े भाषा मॉडल" (LLMs) के लिए। नवीनतम Llama3.1 मॉडल का उदाहरण लेते हुए, इसका 8B संस्करण प्रति सेकंड 1800 टोकन संसाधित कर सकता है, जबकि 70B संस्करण 450 टोकन। यह गति NVIDIA GPU समाधानों की तुलना में 20 गुना अधिक है, और इसकी कीमत भी अधिक प्रतिस्पर्धी है। Cerebras Inference की कीमत केवल प्रति मिलियन टोकन 10 सेंट से शुरू होती है, जबकि 70B संस्करण के लिए 60 सेंट है, जो मौजूदा GPU उत्पादों की तुलना में 100 गुना अधिक लागत प्रभावी है।

यह प्रभावशाली है कि Cerebras Inference ने उद्योग में अग्रणी सटीकता बनाए रखते हुए इस तरह की गति हासिल की है। अन्य गति-प्रमुख समाधानों के विपरीत, Cerebras हमेशा 16-बिट संख्या क्षेत्र में अनुकरण करता है, यह सुनिश्चित करते हुए कि प्रदर्शन में सुधार एआई मॉडल के आउटपुट गुणवत्ता की कीमत पर नहीं होता। मानव विश्लेषण कंपनी के सीईओ मिहा हिल-स्मिथ ने कहा कि Cerebras ने Meta के Llama3.1 मॉडल पर 1,800 से अधिक आउटपुट टोकन प्रति सेकंड की गति प्राप्त की, जिससे एक नया रिकॉर्ड बना।

एआई अनुकरण एआई कंप्यूटिंग का सबसे तेजी से बढ़ता हिस्सा है, जो पूरे एआई हार्डवेयर बाजार का लगभग 40% है। उच्च गति का एआई अनुकरण, जैसे कि Cerebras द्वारा प्रदान किया गया, ब्रॉडबैंड इंटरनेट की उपस्थिति की तरह है, जो नए अवसरों के द्वार खोलता है और एआई अनुप्रयोगों के लिए एक नए युग की शुरुआत करता है। डेवलपर्स Cerebras Inference का उपयोग करके अगली पीढ़ी के एआई अनुप्रयोगों का निर्माण कर सकते हैं, जिन्हें जटिल वास्तविक समय प्रदर्शन की आवश्यकता होती है, जैसे स्मार्ट एजेंट और स्मार्ट सिस्टम।

Cerebras Inference तीन मूल्यवान सेवा स्तर प्रदान करता है: मुफ्त स्तर, डेवलपर स्तर और उद्यम स्तर। मुफ्त स्तर API पहुँच प्रदान करता है, उपयोग की सीमाएँ उदार हैं, और व्यापक उपयोगकर्ताओं के लिए बहुत उपयुक्त है। डेवलपर स्तर लचीले बिना सर्वर तैनाती विकल्प प्रदान करता है, जबकि उद्यम स्तर निरंतर लोड वाले संगठनों के लिए अनुकूलित सेवाएँ और समर्थन प्रदान करता है।

मुख्य तकनीक के संदर्भ में, Cerebras Inference ने Cerebras CS-3 सिस्टम का उपयोग किया है, जो उद्योग में अग्रणी Wafer Scale Engine3 (WSE-3) द्वारा संचालित है। यह एआई प्रोसेसर आकार और गति में बेजोड़ है, जो NVIDIA H100 की तुलना में 7000 गुना अधिक मेमोरी बैंडविड्थ प्रदान करता है।

Cerebras Systems न केवल एआई कंप्यूटिंग क्षेत्र में अग्रणी है, बल्कि स्वास्थ्य सेवा, ऊर्जा, सरकार, वैज्ञानिक गणना और वित्तीय सेवाओं जैसे कई उद्योगों में भी महत्वपूर्ण भूमिका निभा रहा है। तकनीकी नवाचार को लगातार आगे बढ़ाते हुए, Cerebras विभिन्न क्षेत्रों के संगठनों को जटिल एआई चुनौतियों का सामना करने में मदद कर रहा है।

मुख्य बिंदु:
🌟 Cerebras Systems की सेवा की गति 20 गुना बढ़ी, कीमतें अधिक प्रतिस्पर्धी, एआई अनुकरण के नए युग की शुरुआत।
💡 सभी प्रकार के एआई मॉडलों का समर्थन करता है, विशेष रूप से बड़े भाषा मॉडलों (LLMs) में उत्कृष्टता दिखाता है।
🚀 तीन प्रकार की सेवा स्तर प्रदान करता है, जिससे डेवलपर्स और उद्यम उपयोगकर्ताओं को लचीले विकल्प मिलते हैं।

AI समाचार

दुनिया की सबसे तेज़ एआई इन्फेरेंस सेवा का आगाज़! गति में 20 गुना वृद्धि, लागत बेहद कम

AIbase基地

संबंधित AI समाचार अनुशंसाएँ

बायोमेडिकल अनुसंधान में सहायता करने वाला ओपन-सोर्स फ़्रेमवर्क BioChatter, LLM के उपयोग की बाधाओं को कम करता है

सुरक्षा खतरों से सावधान रहें! Ollama बड़े भाषा मॉडल उपकरण में गंभीर कमियाँ पाई गईं

एलेक्सा का व्यापक उन्नयन: बड़े भाषा मॉडल के साथ एकीकरण और AI सहायक परिदृश्य में बदलाव

स्टैनफोर्ड का नया एआई ढांचा OctoTools: बिना प्रशिक्षण के, एआई को कुशल जटिल तर्क करने दें!