Mistral AI ने हाल ही में Saba नामक एक नई भाषा मॉडल लॉन्च की है, जो मध्य पूर्व और दक्षिण पूर्व एशिया के भाषाओं और सांस्कृतिक भिन्नताओं की समझ को बढ़ाने पर केंद्रित है।

Saba मॉडल में 240 अरब पैरामीटर हैं, हालांकि यह कई प्रतिस्पर्धियों की तुलना में छोटा है, लेकिन Mistral AI का दावा है कि यह सटीकता बनाए रखते हुए, उच्च गति और कम लागत प्रदान करता है। इसकी आर्किटेक्चर Mistral Small3 मॉडल के समान हो सकती है। Saba कम प्रदर्शन वाले सिस्टम पर प्रभावी ढंग से काम कर सकती है, यहां तक कि एकल GPU सेटअप में भी प्रति सेकंड 150 से अधिक टोकन की गति प्राप्त कर सकती है।

QQ20250218-091928.png

यह मॉडल विशेष रूप से अरबी और हिंदी को संभालने में माहिर है, जिसमें तमिल और मलयालम जैसे दक्षिण भारतीय भाषाएं शामिल हैं। Mistral AI के बेंचमार्क परीक्षणों ने दिखाया है कि Saba अरबी में उत्कृष्ट प्रदर्शन करती है, जबकि अंग्रेजी के बराबर क्षमता बनाए रखती है।

Saba को वास्तविक परिदृश्यों में लागू किया गया है, जिसमें अरबी वर्चुअल सहायक और ऊर्जा, वित्तीय बाजार और स्वास्थ्य सेवा क्षेत्रों के लिए विशेष उपकरण शामिल हैं। स्थानीय मुहावरों और सांस्कृतिक संदर्भों की समझ इसे विशेष क्षेत्र की सामग्री को प्रभावी ढंग से उत्पन्न करने में सक्षम बनाती है।

उपयोगकर्ता Saba तक पहुंचने के लिए भुगतान किए गए API या स्थानीय तैनाती के माध्यम से पहुंच सकते हैं। Mistral AI के अन्य मॉडलों की तरह, Saba एक ओपन-सोर्स मॉडल नहीं है।

QQ20250218-091823.png

Mistral के बेंचमार्क परीक्षणों ने दिखाया कि Saba अरबी में उत्कृष्ट प्रदर्शन करती है, जबकि अंग्रेजी क्षमता के बराबर | स्रोत:Mistral AI

Saba का लॉन्च, AI क्षेत्र में विशिष्ट क्षेत्रीय भाषा मॉडल की आवश्यकता पर ध्यान केंद्रित करता है। अन्य संगठन, जैसे OpenGPT-X परियोजना (Teuken-7B मॉडल जारी करने वाले), OpenAI (जापानी विशेष GPT-4 मॉडल विकसित करने वाले) और EuroLingua परियोजना (यूरोपीय भाषाओं पर ध्यान केंद्रित करने वाले) भी इसी तरह के अनुसंधान कर रहे हैं।

पारंपरिक बड़े भाषा मॉडल मुख्य रूप से बड़े अंग्रेजी टेक्स्ट डेटासेट पर प्रशिक्षण लेते हैं, जिससे विशिष्ट भाषाओं की बारीकियों को नजरअंदाज किया जा सकता है। Saba इस कमी को पूरा करने के लिए बनाई गई है, जो अधिक सटीक और स्थानीय सांस्कृतिक संदर्भ के अनुरूप भाषा प्रसंस्करण क्षमता प्रदान करती है।