MiniMax-01
एक शक्तिशाली भाषा मॉडल, जिसमें 4560 अरब कुल पैरामीटर हैं, जो 40 लाख टोकन तक के संदर्भ को संभाल सकता है।
सामान्य उत्पादप्रोग्रामिंगकृत्रिम बुद्धिमत्ताभाषा मॉडल
MiniMax-01 एक शक्तिशाली भाषा मॉडल है जिसमें 4560 अरब कुल पैरामीटर हैं, जहाँ प्रत्येक टोकन 459 अरब पैरामीटर को सक्रिय करता है। यह एक मिश्रित आर्किटेक्चर का उपयोग करता है, जिसमें लाइटनिंग अटेंशन, softmax अटेंशन और एक्सपर्ट मिक्सिंग (MoE) शामिल हैं। उन्नत समानांतर रणनीतियों और अभिनव गणना-संचार अतिव्यापी विधियों, जैसे रैखिक ध्यान अनुक्रम समानांतरता प्लस (LASP+), varlen वृत्ताकार ध्यान, और विशेषज्ञ टेंसर समानांतरता (ETP) के माध्यम से, प्रशिक्षण संदर्भ लंबाई को 10 लाख टोकन तक बढ़ाया गया है, और अनुमान के दौरान 40 लाख टोकन तक के संदर्भ को संभाल सकता है। कई शैक्षणिक बेंचमार्क परीक्षणों में, MiniMax-01 ने शीर्ष स्तर के मॉडल का प्रदर्शन दिखाया है।
MiniMax-01 नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
474564576
बाउंस दर
36.20%
प्रति विज़िट औसत पृष्ठ
6.1
औसत विज़िट अवधि
00:06:34