MiniMax-01

एक शक्तिशाली भाषा मॉडल, जिसमें 4560 अरब कुल पैरामीटर हैं, जो 40 लाख टोकन तक के संदर्भ को संभाल सकता है।

सामान्य उत्पादप्रोग्रामिंगकृत्रिम बुद्धिमत्ताभाषा मॉडल
MiniMax-01 एक शक्तिशाली भाषा मॉडल है जिसमें 4560 अरब कुल पैरामीटर हैं, जहाँ प्रत्येक टोकन 459 अरब पैरामीटर को सक्रिय करता है। यह एक मिश्रित आर्किटेक्चर का उपयोग करता है, जिसमें लाइटनिंग अटेंशन, softmax अटेंशन और एक्सपर्ट मिक्सिंग (MoE) शामिल हैं। उन्नत समानांतर रणनीतियों और अभिनव गणना-संचार अतिव्यापी विधियों, जैसे रैखिक ध्यान अनुक्रम समानांतरता प्लस (LASP+), varlen वृत्ताकार ध्यान, और विशेषज्ञ टेंसर समानांतरता (ETP) के माध्यम से, प्रशिक्षण संदर्भ लंबाई को 10 लाख टोकन तक बढ़ाया गया है, और अनुमान के दौरान 40 लाख टोकन तक के संदर्भ को संभाल सकता है। कई शैक्षणिक बेंचमार्क परीक्षणों में, MiniMax-01 ने शीर्ष स्तर के मॉडल का प्रदर्शन दिखाया है।
वेबसाइट खोलें

MiniMax-01 नवीनतम ट्रैफ़िक स्थिति

मासिक कुल विज़िट

474564576

बाउंस दर

36.20%

प्रति विज़िट औसत पृष्ठ

6.1

औसत विज़िट अवधि

00:06:34

MiniMax-01 विज़िट प्रवृत्ति

MiniMax-01 विज़िट भौगोलिक वितरण

MiniMax-01 ट्रैफ़िक स्रोत

MiniMax-01 विकल्प