कल Meta ने सबसे मजबूत ओपन-सोर्स मॉडल Llama3.1 की घोषणा के बाद, Mistral AI ने आज सुबह अपने प्रमुख मॉडल Mistral Large2 को भव्य तरीके से लॉन्च किया, इस नए उत्पाद में 1230 बिलियन पैरामीटर हैं, और इसमें विशाल 128k संदर्भ विंडो है, जो Llama3.1 के मुकाबले खड़ा है।
Mistral Large2 मॉडल विवरण
Mistral Large2 में 128k संदर्भ विंडो है, जो फ्रेंच, जर्मन, स्पेनिश, इतालवी, पुर्तगाली, अरबी, हिंदी, रूसी, चीनी, जापानी और कोरियाई सहित दर्जनों भाषाओं का समर्थन करता है, साथ ही 80 से अधिक प्रोग्रामिंग भाषाओं जैसे Python, Java, C, C++, JavaScript और Bash का भी समर्थन करता है।
Mistral Large2 को एकल नोड इनफेरेंस के लिए डिज़ाइन किया गया है, विशेष रूप से लंबे संदर्भ अनुप्रयोगों के लिए - इसके 1230 बिलियन पैरामीटर का आकार इसे एकल नोड पर उच्च थ्रूपुट के साथ चलाने की क्षमता प्रदान करता है। Mistral Large2 Mistral अनुसंधान लाइसेंस के तहत जारी किया गया है, जिसका उद्देश्य अनुसंधान और गैर-व्यावसायिक उपयोग के लिए है; यदि व्यावसायिक आवश्यकता है, तो उपयोगकर्ताओं को व्यावसायिक लाइसेंस प्राप्त करने के लिए संपर्क करना होगा।
कुल प्रदर्शन:
प्रदर्शन के मामले में, Mistral Large2 ने मूल्यांकन मापदंडों पर नए मानक स्थापित किए हैं, विशेष रूप से MMLU बेंचमार्क परीक्षण में 84.0% सटीकता प्राप्त की है, जो शक्तिशाली प्रदर्शन और सेवा लागत के बीच संतुलन को प्रदर्शित करता है।
कोड और इनफेरेंस
Codestral22B और Codestral Mamba के प्रशिक्षण अनुभव के माध्यम से, Mistral Large2 कोड प्रोसेसिंग में उत्कृष्ट प्रदर्शन करता है, यह GPT-4o, Claude3Opus और Llama3405B जैसे शीर्ष मॉडलों के साथ प्रतिस्पर्धा करता है।
निर्देश पालन और संरेखण
Mistral Large2 ने निर्देश पालन और संवाद क्षमता में भी महत्वपूर्ण प्रगति की है, विशेष रूप से जटिल, बहु-चरण संवाद को संभालने में अधिक लचीला है। कुछ बेंचमार्क परीक्षणों में, लंबे उत्तर उत्पन्न करना अक्सर स्कोर बढ़ाता है। हालाँकि, कई व्यावसायिक अनुप्रयोगों में, संक्षिप्तता महत्वपूर्ण है - छोटे मॉडल द्वारा उत्पन्न उत्तर बातचीत की गति को बढ़ाने में मदद करते हैं और इनफेरेंस को अधिक लागत प्रभावी बनाते हैं।
भाषा विविधता
नया Mistral Large2 बड़े पैमाने पर बहुभाषी डेटा पर प्रशिक्षित किया गया है, विशेष रूप से अंग्रेजी, फ्रेंच, जर्मन, स्पेनिश, इतालवी, पुर्तगाली, डच, रूसी, चीनी, जापानी, कोरियाई, अरबी और हिंदी में उत्कृष्टता प्रदर्शित करता है। निम्नलिखित Mistral Large2 के बहुभाषी MMLU बेंचमार्क पर प्रदर्शन परिणाम हैं, जो पिछले Mistral Large, Llama3.1 मॉडल और Cohere के Command R+ के साथ तुलना में हैं।
उपकरण उपयोग और फ़ंक्शन कॉल
Mistral Large2 में उन्नत फ़ंक्शन कॉल और पुनर्प्राप्ति कौशल हैं, और इसे समानांतर और अनुक्रम फ़ंक्शन कॉल को कुशलता से निष्पादित करने के लिए प्रशिक्षित किया गया है, जिससे यह जटिल व्यावसायिक अनुप्रयोगों के लिए एक प्रेरक इंजन बन जाता है।
उपयोग करने का तरीका:
वर्तमान में, उपयोगकर्ता la Plateforme (https://console.mistral.ai/) पर Mistral Large2 का उपयोग कर सकते हैं, जिसका नाम है mistral-large-2407
, और इसे le Chat पर परीक्षण कर सकते हैं। यह संस्करण 24.07 (हम सभी मॉडलों के लिए YY.MM संस्करण नियंत्रण प्रणाली का उपयोग करते हैं) और API नाम के तहत mistral-large-2407
पर उपलब्ध है। निर्देश मॉडल के वज़न उपलब्ध हैं, और यह HuggingFace पर भी होस्ट किया गया है (https://huggingface.co/mistralai/Mistral-Large-Instruct-2407)।
La Plateforme पर उत्पादों में दो सामान्य मॉडल Mistral Nemo और Mistral Large, और दो विशेष मॉडल Codestral और Embed शामिल हैं। जैसे-जैसे हम La Plateforme पर पुराने मॉडलों का धीरे-धीरे उपयोग बंद कर रहे हैं, सभी Apache मॉडल (Mistral7B, Mixtral8x7B और 8x22B, Codestral Mamba, Mathstral) अभी भी SDK mistral-inference और mistral-finetune के माध्यम से तैनात और माइक्रो-ट्यून करने के लिए उपलब्ध हैं।
आज से, उत्पाद la Plateforme पर माइक्रो-ट्यूनिंग कार्यक्षमता का विस्तार करेगा: ये सुविधाएँ अब Mistral Large, Mistral Nemo और Codestral के लिए उपलब्ध हैं।
Mistral AI ने Mistral Large2 को वैश्विक स्तर पर उपलब्ध कराने के लिए कई प्रमुख क्लाउड सेवा प्रदाताओं के साथ सहयोग किया है, विशेष रूप से Google Cloud Platform के Vertex AI में इसे भी पाया जा सकता है।
** मुख्य बिंदु:**
🌟 Mistral Large2 में 128k संदर्भ विंडो है, जो दस भाषाओं और 80 से अधिक प्रोग्रामिंग भाषाओं का समर्थन करता है।
📈 MMLU बेंचमार्क परीक्षण में 84.0% सटीकता प्राप्त की है, प्रदर्शन और लागत के मामले में उत्कृष्टता प्रदर्शित की है।
💻 उपयोगकर्ता नए मॉडल तक पहुंच प्राप्त कर सकते हैं और क्लाउड सेवा प्लेटफार्मों पर व्यापक रूप से इसका उपयोग कर सकते हैं।