चीन की आर्टिफिशियल इंटेलिजेंस कंपनी DeepSeek ने अपने "ओपन सोर्स वीक" के तीसरे दिन DeepGEMM लॉन्च करने की घोषणा की - जो FP8 सामान्य मैट्रिक्स गुणन (GEMM) को सपोर्ट करने वाला एक ओपन सोर्स लाइब्रेरी है। यह टूल घने और मिश्रित विशेषज्ञ (MoE) मैट्रिक्स ऑपरेशन के लिए डिज़ाइन किया गया है, जो DeepSeek V3 और R1 मॉडल के प्रशिक्षण और अनुमान के लिए शक्तिशाली सपोर्ट प्रदान करता है। आधिकारिक जानकारी X प्लेटफ़ॉर्म के माध्यम से जारी की गई, जिससे तकनीकी समुदाय में तुरंत उत्साह देखा गया।
DeepSeek के आधिकारिक अकाउंट द्वारा पोस्ट किए गए पोस्ट के अनुसार, DeepGEMM NVIDIA Hopper GPU पर 1350+ TFLOPS तक का FP8 गणना प्रदर्शन प्राप्त कर सकता है। इसका कोर लॉजिक लगभग 300 लाइनों का कोड है, फिर भी यह अधिकांश मैट्रिक्स आकारों में विशेषज्ञ-ट्यून्ड कर्नेल को पार कर जाता है, जो इसकी उच्च दक्षता और सादगी को दर्शाता है। इस लाइब्रेरी को जटिल निर्भरताओं की आवश्यकता नहीं है, यह जस्ट-इन-टाइम (JIT) तकनीक का उपयोग करता है, घने लेआउट और दो MoE लेआउट का समर्थन करता है, और इसे "ट्यूटोरियल की तरह साफ" डिज़ाइन किया गया है, जिससे डेवलपर्स के लिए सीखना और उपयोग करना आसान हो जाता है।
X उपयोगकर्ता @TechBitDaily ने टिप्पणी की: "DeepGEMM का लॉन्च DeepSeek के ओपन सोर्स वीक का एक मुख्य आकर्षण है, इसका FP8 प्रदर्शन और सरल डिज़ाइन प्रभावशाली है।" एक अन्य उपयोगकर्ता @AIObserverCN ने बताया कि इस लाइब्रेरी में MoE मॉडल के कुशल प्रशिक्षण का समर्थन करने में उल्लेखनीय लाभ है, जो Hopper आर्किटेक्चर पर AI समुदाय में आगे के नवाचार को बढ़ावा दे सकता है।
ओपन सोर्स वीक के हिस्से के रूप में, DeepGEMM का लॉन्च AI तकनीक के पारदर्शिता और समुदाय सहयोग को बढ़ावा देने के DeepSeek के वादे को जारी रखता है। इससे पहले, कंपनी ने पहले दो दिनों में FlashMLA और DeepEP टूल लॉन्च किए थे, जो क्रमशः तेज़ भाषा मॉडल आर्किटेक्चर और विशेषज्ञ समानांतर संचार पर केंद्रित हैं। DeepGEMM की इस शुरुआत ने AI बुनियादी ढाँचे के निर्माण में अपनी तकनीकी क्षमता को और प्रदर्शित किया है। उद्योग के विशेषज्ञों का मानना है कि यह लाइब्रेरी न केवल DeepSeek के अपने मॉडल के प्रदर्शन को बेहतर बनाएगी, बल्कि वैश्विक डेवलपर्स को एक कुशल और उपयोग में आसान मैट्रिक्स ऑपरेशन टूल भी प्रदान करेगी, जिसका भविष्य में उपयोग किया जा सकता है। उपयोगकर्ता अब GitHub से DeepGEMM प्राप्त कर सकते हैं और AI प्रशिक्षण और अनुमान में इसकी क्षमता का पता लगा सकते हैं।
प्रोजेक्ट पता: https://github.com/deepseek-ai/DeepGEMM