Mistral कंपनी ने हाल ही में अपने नवीनतम ओपन-सोर्स कोडिंग मॉडल - Codestral25.01 की घोषणा की, जो इसके लोकप्रिय कोडिंग मॉडल Codestral का उन्नत संस्करण है। इस संस्करण में आर्किटेक्चर का अनुकूलन किया गया है, जिससे प्रदर्शन में उल्लेखनीय सुधार हुआ है, और यह "भारी कोडिंग का स्पष्ट नेता" बन गया है, इसकी गति पिछले संस्करण की तुलना में दो गुना बढ़ गई है।

मूल संस्करण Codestral के समान, Codestral25.01 अब भी कम विलंबता और उच्च आवृत्ति संचालन पर केंद्रित है, जो कोड सुधार, परीक्षण उत्पन्न करने और मध्यवर्ती भराई कार्य का समर्थन करता है। Mistral कंपनी ने कहा कि यह संस्करण विशेष रूप से उन कंपनियों के लिए उपयुक्त है जिन्हें अधिक डेटा और मॉडल स्थायित्व की आवश्यकता होती है। बेंचमार्क परीक्षणों से पता चला है कि Codestral25.01 ने Python कोडिंग परीक्षण में अपेक्षाओं को पार कर लिया, HumanEval परीक्षण में 86.6% स्कोर किया, जो पिछले संस्करण, Codellama70B Instruct और DeepSeek Coder33B Instruct से काफी बेहतर है।

Screenshot_121-transformed-2.jpg

डेवलपर्स इस मॉडल को Mistral IDE प्लगइन और स्थानीय तैनाती उपकरण Continue के माध्यम से एक्सेस कर सकते हैं, इसके अलावा, Mistral ने Google Vertex AI और Mistral la Plateforme के माध्यम से API एक्सेस प्रदान किया है। यह मॉडल वर्तमान में Azure AI Foundry पर पूर्वावलोकन के लिए उपलब्ध है, और जल्द ही Amazon Bedrock प्लेटफॉर्म पर लॉन्च होगा।

पिछले वर्ष में लॉन्च होने के बाद से, Mistral का Codestral कोड-केंद्रित ओपन-सोर्स मॉडलों में सबसे अच्छा बन गया है। इसका पहला संस्करण Codestral एक 22B पैरामीटर मॉडल है, जो 80 से अधिक भाषाओं का समर्थन करता है और कोडिंग प्रदर्शन में कई समान उत्पादों से बेहतर है। इसके तुरंत बाद, Mistral ने Codestral-Mamba लॉन्च किया, जो Mamba आर्किटेक्चर पर आधारित एक कोड जनरेशन मॉडल है, जो लंबे कोड अनुक्रमों को संभाल सकता है और अधिक इनपुट आवश्यकताओं का सामना कर सकता है।

codestral-25-01-chat.jpg

Codestral25.01 की लॉन्चिंग ने डेवलपर्स का व्यापक ध्यान आकर्षित किया, और इसके जारी होने के कुछ घंटों के भीतर ही C o pilot Arena चार्ट पर शीर्ष स्थान पर पहुंच गया। यह प्रवृत्ति दिखाती है कि विशेषीकृत कोडिंग मॉडल तेजी से डेवलपर्स की पसंद बन रहे हैं, विशेष रूप से कोडिंग कार्यों के क्षेत्र में, बहुउद्देश्यीय सामान्य मॉडल की तुलना में, विशेष कोडिंग मॉडल की मांग अधिक स्पष्ट हो रही है।

हालांकि OpenAI का o3 और Anthropic का Claude जैसे सामान्य मॉडल भी कोडिंग कर सकते हैं, लेकिन विशेष रूप से अनुकूलित कोडिंग मॉडल अक्सर प्रदर्शन में बेहतर होते हैं। पिछले वर्ष में, कई कंपनियों ने कोडिंग के लिए विशेष मॉडल जारी किए हैं, जैसे अलीबाबा का Qwen2.5-Coder और चीन का DeepSeek Coder, जिसने GPT-4Turbo को पार करने वाला पहला मॉडल बनने का गौरव हासिल किया। इसके अलावा, माइक्रोसॉफ्ट ने विशेषज्ञ मिश्रित मॉडल (MOE) पर आधारित GRIN-MoE लॉन्च किया, जो न केवल कोडिंग कर सकता है, बल्कि गणितीय समस्याओं को भी हल कर सकता है।

हालांकि डेवलपर्स अब भी सामान्य मॉडल या विशेष मॉडल चुनने पर बहस कर रहे हैं, लेकिन कोडिंग मॉडल की तेज वृद्धि उच्च गुणवत्ता, सटीक कोडिंग उपकरण की विशाल मांग को दर्शाती है। कोडिंग कार्यों के लिए विशेष रूप से प्रशिक्षित होने के कारण, Codestral25.01 निस्संदेह भविष्य के कोडिंग क्षेत्र में एक स्थान रखता है।