MiniMax ने 2024 के 16 जनवरी को देश का पहला MoE बड़ा भाषा मॉडल abab6 जारी किया, जो MoE आर्किटेक्चर को अपनाता है, जटिल कार्यों को संभालने की क्षमता रखता है, और एक निश्चित समय में अधिक डेटा को प्रशिक्षित करने में सक्षम है। मूल्यांकन परिणामों से पता चलता है कि abab6 निर्देश पालन, चीनी समग्र क्षमता और अंग्रेजी समग्र क्षमता में पिछले संस्करण abab5.5 से बेहतर है, और अन्य बड़े भाषा मॉडलों जैसे GPT-3.5 को भी पार कर गया है। abab6 उत्कृष्ट क्षमताएँ प्रदर्शित करता है, जैसे बच्चों को गणित के प्रश्न सिखाना और शंघाई पर एक काल्पनिक बोर्ड गेम बनाने में मदद करना। देश के पहले MoE बड़े भाषा मॉडल के रूप में, abab6 जटिल कार्यों को संभालने में उत्कृष्ट प्रदर्शन करता है।
MiniMax ने भारत में पहला MoE बड़ा भाषा मॉडल abab6 लॉन्च किया
