बहुप्रतीक्षित Deepseek V3 अंततः ओपन-सोर्स हो गया! यह नया AI मॉडल बहुभाषी प्रोग्रामिंग क्षमताओं में एक महत्वपूर्ण प्रगति हासिल करता है, और इसका प्रदर्शन aider बहुभाषी प्रोग्रामिंग मूल्यांकन में Claude3.5Sonnet V2 जैसे प्रतिस्पर्धियों को भी पीछे छोड़ देता है, जिससे उद्योग में व्यापक ध्यान आकर्षित हुआ है।
जानकारी के अनुसार, Deepseek V3 पिछले संस्करणों की तुलना में प्रदर्शन में गुणात्मक छलांग लगाने में सफल रहा है। Deepseek V2.5 ने aider मूल्यांकन में केवल 17% सफलता दर दर्ज की, जबकि V3 की सफलता दर बढ़कर 48% हो गई, जो इसके शक्तिशाली विकास को स्पष्ट रूप से दर्शाता है।
Deepseek V3 में 6850 अरब पैरामीटर वाला मिश्रित विशेषज्ञ (MoE) आर्किटेक्चर शामिल है। इस आर्किटेक्चर में 256 विशेषज्ञ शामिल हैं और यह सिग्मॉइड रूटिंग विधि का उपयोग करता है, जिसमें प्रत्येक बार पहले 8 विशेषज्ञों (topk=8) को गणना में भाग लेने के लिए चुना जाता है, यह डिज़ाइन मॉडल को जटिल कार्यों को अधिक कुशलता से संभालने और प्रदर्शन में सुधार करने की अनुमति देता है।
Deepseek V3 का ओपन-सोर्स होना निश्चित रूप से AI समुदाय में नई ऊर्जा लाएगा। इसकी शक्तिशाली प्रोग्रामिंग क्षमताएँ सॉफ्टवेयर विकास, स्वचालन आदि क्षेत्रों में महत्वपूर्ण भूमिका निभाने की उम्मीद है, जो विभिन्न उद्योगों के स्मार्ट अपग्रेड में नई ऊर्जा का संचार करेगी।
पता: https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main