फ्रांस की AI स्टार्टअप कंपनी Les Ministraux ने दो नए हल्के मॉडल Ministral3B और Ministral8B लॉन्च किए हैं, जो विशेष रूप से एज डिवाइस के लिए डिज़ाइन किए गए हैं, जिनमें क्रमशः 30 बिलियन और 80 बिलियन पैरामीटर हैं। ये दोनों मॉडल निर्देश पालन बेंचमार्क परीक्षण में उत्कृष्ट प्रदर्शन करते हैं, Ministral3B ने Llama38B और Mistral7B को पीछे छोड़ दिया है, जबकि Ministral8B ने कोड क्षमता को छोड़कर अन्य सभी पहलुओं में इन दोनों मॉडलों को बेहतर प्रदर्शन किया है।

image.png

परीक्षण परिणामों से पता चलता है कि Ministral3B और Ministral8B का प्रदर्शन Gemma2 और Llama3.1 जैसे ओपन-सोर्स मॉडलों के बराबर है। ये दोनों मॉडल 128k तक के संदर्भ का समर्थन करते हैं और ज्ञान, सामान्य ज्ञान, तर्क, फ़ंक्शन कॉल और दक्षता के मामले में 10B से कम पैरामीटर वाले मॉडलों के लिए एक नया मानक स्थापित करते हैं। Ministral8B में तेज और अधिक कुशल मेमोरी इनफेरेंस के लिए स्लाइडिंग विंडो ध्यान तंत्र भी है। इन्हें विभिन्न उपयोग के मामलों में ट्यून किया जा सकता है, जैसे जटिल AI एजेंट वर्कफ़्लो का प्रबंधन करना या विशेष कार्य सहायक बनाना।

image.png

शोधकर्ताओं ने Les Ministraux मॉडल पर कई बेंचमार्क परीक्षण किए, जो ज्ञान और सामान्य ज्ञान, कोड, गणित और बहुभाषा जैसे क्षेत्रों को कवर करते हैं। प्री-ट्रेनिंग मॉडल चरण में, Ministral3B ने Gema22B और Llama3.23B की तुलना में सर्वश्रेष्ठ परिणाम प्राप्त किए। Ministral8B ने Llama3.18B और Mistral7B की तुलना में कोड क्षमता को छोड़कर अन्य सभी क्षेत्रों में सर्वश्रेष्ठ प्रदर्शन किया। फाइन-ट्यून किए गए निर्देश मॉडल चरण में, Ministral3B ने विभिन्न बेंचमार्क परीक्षणों में सर्वश्रेष्ठ परिणाम प्राप्त किए, जबकि Ministral8B केवल Wild bench पर Gema29B से थोड़ा पीछे रहा।

image.png

image.png

Les Ministraux मॉडल के लॉन्च ने उपयोगकर्ताओं को उच्च गणना दक्षता और कम विलंबता समाधान प्रदान किए हैं, जो प्रमुख अनुप्रयोगों के लिए स्थानीय प्राथमिकता इनफेरेंस की बढ़ती मांग को पूरा करते हैं। उपयोगकर्ता इन मॉडलों का उपयोग डिवाइस पर अनुवाद, इंटरनेट के बिना स्मार्ट सहायक और स्वचालित रोबोट जैसे दृश्यों में कर सकते हैं। Ministral8B की इनपुट आउटपुट कीमत प्रति मिलियन टोकन 0.1 डॉलर है, जबकि Ministral3B की कीमत प्रति मिलियन टोकन 0.04 डॉलर है।

image.png

यह ध्यान देने योग्य है कि Mistral कंपनी ने पहले कई मॉडलों को मैग्नेटिक लिंक के माध्यम से ओपन-सोर्स किया था और AI समुदाय से मान्यता प्राप्त की थी। हालांकि, इस साल कंपनी विवादों में पड़ गई है क्योंकि अब यह पहले की तरह खुली नहीं है। रिपोर्ट्स के अनुसार, माइक्रोसॉफ्ट Mistral के कुछ शेयरों का अधिग्रहण करने और उसमें निवेश करने की योजना बना रहा है, जिसका अर्थ है कि Mistral के मॉडल Azure AI पर होस्ट किए जाएंगे। Reddit उपयोगकर्ताओं ने पाया कि Mistral ने अपनी वेबसाइट से ओपन-सोर्स के वादे को हटा दिया है। कंपनी के कुछ मॉडलों में भी शुल्क लिया जाने लगा है, जिसमें हाल ही में लॉन्च किए गए Ministral3B और Ministral8B शामिल हैं।

विवरण: https://mistral.ai/news/ministraux/