हाल ही में, Inflection AI ने अपने नवीनतम व्यावसायिक प्लेटफ़ॉर्म पर एक आकर्षक निर्णय लिया: Nvidia के GPU का उपयोग छोड़कर Intel के Gaudi3 त्वरक को अपनाना। यह परिवर्तन कंपनी की AI क्षेत्र में रणनीतिक समायोजन को दर्शाता है, पहले इसके "Pi" ग्राहक अनुप्रयोग Nvidia के GPU पर चलते थे। अब, Inflection3.0 Gaudi3 पर निर्भर करेगा, उपयोगकर्ता इसे स्थानीय या क्लाउड के Tiber AI Cloud पर चलाने का विकल्प चुन सकते हैं।

चिप AI चित्रण (1)

चित्र स्रोत नोट: चित्र AI द्वारा उत्पन्न, चित्र अनुज्ञा सेवा प्रदाता Midjourney

Inflection AI की स्थापना 2022 में हुई थी, जो शुरू में एक संवादात्मक व्यक्तिगत सहायक "Pi" विकसित करने पर केंद्रित थी। हालाँकि, संस्थापक Mustafa Suleyman और Karén Simonyan के वसंत में Microsoft में शामिल होने के बाद, कंपनी ने कस्टम ट्यूनिंग मॉडल बनाने पर ध्यान केंद्रित करना शुरू किया, जो ग्राहकों के डेटा का उपयोग करके सेवा की गुणवत्ता को बढ़ाता है।

Inflection3.0 इस प्लेटफ़ॉर्म का नवीनतम संस्करण है, जिसका लक्ष्य विशेष AI अनुप्रयोग बनाने के लिए विशेष डेटा सेट का उपयोग करके मॉडल को ट्यून करना है। यह ध्यान देने योग्य है कि Intel इस सेवा का उपयोग करने वाले पहले ग्राहकों में से एक होगा, जिससे यह अनुमान लगाया जा सकता है कि क्या Inflection इन त्वरकों के लिए पूरा मूल्य चुकाएगा।

हालाँकि Inflection अपने सेवाओं को Gaudi3 त्वरक पर चलाने की योजना बना रहा है, लेकिन स्पष्ट रूप से यह प्रणाली को जल्दी स्थापित नहीं करेगा। पिछले Inflection2.5 की तरह, नवीनतम संस्करण भी Intel के Tiber AI Cloud सेवा पर चलेगा। हालाँकि, Inflection ने महसूस किया कि कुछ ग्राहक अपने डेटा को स्थानीय रूप से रखना चाह सकते हैं, इसलिए यह 2025 की पहली तिमाही से Intel AI त्वरकों पर आधारित भौतिक सिस्टम प्रदान करने की योजना बना रहा है।

Gaudi3 त्वरक का एक लाभ यह है कि Inflection ने मूल्य-प्रदर्शन में भारी सुधार किया है। Inflection AI के CEO Sean White ने ब्लॉग में कहा कि Intel की तकनीक का उपयोग करके, उन्होंने वर्तमान प्रतिस्पर्धी उत्पादों की तुलना में मूल्य-प्रदर्शन में दो गुना सुधार देखा है। Gaudi3 को प्रशिक्षण और अनुमान लगाने की गति में Nvidia के H100 की तुलना में तेज और लागत में कम माना गया है।

Gaudi3 की तकनीकी विशिष्टताएँ भी काफी मजबूत हैं, जिसमें 128GB HBM2e मेमोरी, 3.7Tbps तक की बैंडविड्थ और 1,835teraFLOPS की घनी FP8 या BF16 प्रदर्शन क्षमता है। 16-बिट सटीकता में, Gaudi3 की फ्लोटिंग पॉइंट प्रदर्शन लगभग H100 की दो गुना है, जो Inflection के प्रशिक्षण और ट्यूनिंग कार्यभार के लिए बहुत महत्वपूर्ण है।

इसके अलावा, Intel ने हाल ही में घोषणा की कि IBM अपने क्लाउड प्लेटफ़ॉर्म में Gaudi3 त्वरक को तैनात करेगा और 2025 की शुरुआत में इसे लॉन्च करने की योजना बना रहा है। इसका मतलब है कि Gaudi3 त्वरक धीरे-धीरे बाजार में मान्यता प्राप्त कर रहा है।

मुख्य बिंदु:

🌟 Inflection AI ने Nvidia GPUs को छोड़ने और Intel के Gaudi3 त्वरक को अपनाने का निर्णय लिया।

🚀 Inflection3.0 Gaudi3 के आधार पर, व्यवसायों के लिए कस्टम AI अनुप्रयोग प्रदान करेगा।

💰 Gaudi3 का उपयोग करके, Inflection AI ने मूल्य-प्रदर्शन में दो गुना सुधार किया है।