तेज़ी से विकसित हो रहे आर्टिफ़िशियल इंटेलिजेंस के क्षेत्र में, डेवलपर्स और संगठन कई व्यावहारिक चुनौतियों का सामना कर रहे हैं, जैसे कि उच्च कम्प्यूटेशनल आवश्यकताएँ, विलम्बता की समस्याएँ और वास्तव में लचीले ओपन-सोर्स मॉडल की कमी। ये समस्याएँ अक्सर प्रगति को सीमित करती हैं, कई मौजूदा समाधानों के लिए महँगे क्लाउड इन्फ्रास्ट्रक्चर की आवश्यकता होती है, या वे बहुत बड़े होते हैं, डिवाइस पर उपयोग करने के लिए अनुपयुक्त होते हैं, इसलिए इस अंतर को भरने के लिए कुशल और लचीले मॉडल की तत्काल आवश्यकता है।

QQ_1741747624441.png

इस उद्देश्य के लिए, Reka AI ने Reka Flash3 लॉन्च किया है, जो एक शून्य से निर्मित अनुमान मॉडल है जिसमें 2.1 अरब पैरामीटर हैं। यह मॉडल सामान्य वार्तालाप, कोडिंग सहायता, निर्देशों का पालन और यहां तक कि फ़ंक्शन कॉल का समर्थन करने के लिए डिज़ाइन किया गया है, जो विभिन्न अनुप्रयोगों के लिए एक व्यावहारिक आधार बनता है। इसके प्रशिक्षण में सार्वजनिक रूप से उपलब्ध डेटासेट और सिंथेटिक डेटासेट का संयोजन शामिल है, और इसे सावधानीपूर्वक निर्देश ट्यूनिंग और REINFORCE Leave One-Out (RLOO) विधि के माध्यम से प्रबलित सीखने के द्वारा प्रशिक्षित किया गया है। यह व्यापक प्रशिक्षण विधि क्षमता और दक्षता के बीच संतुलन बनाने के लिए डिज़ाइन की गई है, जिससे Reka Flash3 कई समान मॉडलों में अलग दिखता है।

तकनीकी स्तर पर, Reka Flash3 में कई विशेषताएँ हैं जो इसे लचीला और संसाधन-कुशल बनाती हैं। एक उल्लेखनीय विशेषता इसकी अधिकतम 32k टोकन संदर्भ लंबाई को संभालने की क्षमता है, जो लंबे दस्तावेज़ों और जटिल कार्यों को संभालना आसान बनाती है, बिना अधिक दबाव डाले। इसके अतिरिक्त, मॉडल में एक "बजट बाध्यता" तंत्र भी शामिल है, जो विशिष्ट <reasoning> टैग का उपयोग करके उपयोगकर्ताओं को मॉडल की सोच प्रक्रिया के चरणों को सीमित करने की अनुमति देता है, जिससे कम्प्यूटेशनल ओवरहेड को बढ़ाए बिना सुसंगत प्रदर्शन सुनिश्चित होता है। साथ ही, Reka Flash3 डिवाइस पर परिनियोजन के लिए बहुत उपयुक्त है, पूर्ण परिशुद्धता आकार 39GB (fp16) है, और 4-बिट क्वांटाइजेशन के माध्यम से इसे 11GB तक और संकुचित किया जा सकता है। यह लचीलापन स्थानीय परिनियोजन को अधिक सहज बनाता है, जो बड़े और संसाधन-गहन मॉडलों की तुलना में अधिक फायदेमंद है।

मूल्यांकन मीट्रिक और प्रदर्शन डेटा मॉडल की व्यावहारिकता को और पुष्ट करते हैं। उदाहरण के लिए, हालाँकि Reka Flash3 का MMLU-Pro में स्कोर 65.0 है, जो औसत है, लेकिन वेब खोज जैसे अतिरिक्त ज्ञान स्रोतों के साथ, इसकी प्रतिस्पर्धा अभी भी नज़रअंदाज़ नहीं की जा सकती है। इसके अतिरिक्त, Reka Flash3 की बहुभाषी क्षमता WMT'23 में COMET स्कोर 83.2 तक पहुँचती है, जो गैर-अंग्रेजी इनपुट के लिए इसके उचित समर्थन को दर्शाता है, हालाँकि यह मुख्य रूप से अंग्रेजी पर केंद्रित है। ये परिणाम, QwQ-32B जैसे समकक्षों की तुलना में इसकी कुशल पैरामीटर संख्या के साथ, वास्तविक अनुप्रयोगों में इसकी क्षमता को उजागर करते हैं।

QQ_1741747656664.png

संक्षेप में, Reka Flash3 एक अधिक सुलभ आर्टिफ़िशियल इंटेलिजेंस समाधान का प्रतिनिधित्व करता है। प्रदर्शन और दक्षता के बीच एक चतुर संतुलन बनाकर, यह मॉडल सामान्य चैट, कोडिंग और निर्देश कार्यों के लिए एक मज़बूत और लचीला विकल्प प्रदान करता है। इसका कॉम्पैक्ट डिज़ाइन, उन्नत 32k टोकन संदर्भ विंडो और नवीन बजट बाध्यता तंत्र इसे डिवाइस पर परिनियोजन और कम विलम्बता अनुप्रयोगों के लिए एक व्यावहारिक विकल्प बनाते हैं। उन शोधकर्ताओं और डेवलपर्स के लिए जो एक शक्तिशाली और प्रबंधनीय मॉडल की तलाश में हैं, Reka Flash3 निस्संदेह एक आशाजनक आधार प्रदान करता है।

परिचय:https://www.reka.ai/news/introducing-reka-flash

मॉडल: https://huggingface.co/RekaAI/reka-flash-3

मुख्य बातें:  

🌟 Reka Flash3 Reka AI द्वारा लॉन्च किया गया एक ओपन-सोर्स अनुमान मॉडल है, जिसमें 2.1 अरब पैरामीटर हैं, जो कई अनुप्रयोग परिदृश्यों के लिए उपयुक्त है।  

💻 यह मॉडल 32k टोकन संदर्भ प्रसंस्करण का समर्थन करता है, जो जटिल कार्यों को संभालने के लिए उपयुक्त है, और इसे डिवाइस पर कुशलतापूर्वक चलाया जा सकता है।  

📈 प्रदर्शन डेटा दर्शाता है कि Reka Flash3 बहुभाषी क्षमता और व्यावहारिक अनुप्रयोगों में उत्कृष्ट प्रदर्शन करता है, जो एक सुलभ AI समाधान है।