Mistral AI ने हाल ही में अपने नवीनतम बड़े भाषा मॉडल Mistral Large2 की घोषणा की है, जो लागत प्रभावशीलता, गति और प्रदर्शन के मामले में महत्वपूर्ण प्रगति करता है।
मॉडल का अवलोकन
Mistral Large2 एक ऐसा मॉडल है जिसमें 1230 अरब पैरामीटर हैं, जिसमें 128K का संदर्भ विंडो है। यह अंग्रेजी, फ्रेंच, जर्मन, स्पेनिश, इतालवी, पुर्तगाली, अरबी, हिंदी, रूसी, चीनी, जापानी और कोरियाई सहित दर्जनों भाषाओं का समर्थन करता है, साथ ही Python, Java, C, C++, JavaScript और Bash जैसी 80 से अधिक प्रोग्रामिंग भाषाओं का भी समर्थन करता है।
प्रदर्शन के मुख्य बिंदु
सामान्य प्रदर्शन: MMLU परीक्षण में, Mistral Large2 के पूर्व-प्रशिक्षित संस्करण ने 84.0% की सटीकता प्राप्त की।
कोड और तर्क क्षमता: कोड जनरेशन और गणितीय तर्क के मामले में, Mistral Large2 का प्रदर्शन GPT-4, Claude3Opus और Llama3405B जैसे प्रमुख मॉडलों के बराबर है।
बहुभाषी क्षमता: बहुभाषी MMLU मानक परीक्षण में, Mistral Large2 ने उत्कृष्ट बहुभाषी प्रसंस्करण क्षमता दिखाई, विशेष रूप से अंग्रेजी, फ्रेंच, जर्मन जैसी प्रमुख भाषाओं में शानदार प्रदर्शन किया।
निर्देश पालन और संरेखण: MT-Bench, Wild Bench और Arena Hard जैसे मानक परीक्षणों में, Mistral Large2 ने निर्देश पालन और संवाद क्षमता में महत्वपूर्ण सुधार किया।
उपकरण उपयोग और फ़ंक्शन कॉल: मॉडल को प्रशिक्षित किया गया है ताकि वह समानांतर और अनुक्रमिक फ़ंक्शन कॉल को कुशलता से निष्पादित कर सके, जटिल व्यावसायिक अनुप्रयोगों के लिए मजबूत समर्थन प्रदान कर सके।
तकनीकी विशेषताएँ
"भ्रम" की घटनाओं को काफी कम किया गया है, जिससे आउटपुट की विश्वसनीयता और सटीकता में सुधार हुआ है।
जब समाधान या जानकारी नहीं मिलती है, तो मॉडल की आत्म-ज्ञान क्षमता को बढ़ाया गया है।
संक्षिप्त और सीधे उत्तर उत्पन्न करने पर ध्यान केंद्रित किया गया है, जिससे बातचीत की दक्षता और लागत प्रभावशीलता बढ़ती है।
अनुप्रयोग और उपलब्धता
Mistral Large2 अब la Plateforme पर "mistral-large-2407" नाम से उपलब्ध है।
मॉडल का वजन सार्वजनिक किया गया है और इसे HuggingFace पर होस्ट किया गया है।
Mistral AI ने Google Cloud Platform के साथ अपने सहयोग का विस्तार किया है और Vertex AI के माध्यम से प्रबंधित API सेवाएं प्रदान करता है।
यह मॉडल Azure AI Studio, Amazon Bedrock और IBM watsonx.ai जैसे क्लाउड सेवा प्रदाताओं के माध्यम से भी उपलब्ध है।
अनुमति और उपयोग की शर्तें
Mistral Large2 को Mistral Research License के तहत जारी किया गया है, जो अनुसंधान और गैर-व्यावसायिक उपयोग की अनुमति देता है। व्यावसायिक उपयोग के लिए Mistral Commercial License प्राप्त करना आवश्यक है।
इस नए मॉडल का विमोचन Mistral AI के बड़े भाषा मॉडल क्षेत्र में महत्वपूर्ण प्रगति को दर्शाता है, जो कृत्रिम बुद्धिमत्ता अनुप्रयोग डेवलपर्स को अधिक शक्तिशाली और लचीले उपकरण प्रदान करता है, जो विभिन्न उद्योगों में नवाचार अनुप्रयोगों को बढ़ावा देने की उम्मीद है।