MiniMax-01
Modèle linguistique puissant disposant de 456 milliards de paramètres au total, capable de traiter un contexte jusqu'à 4 millions de jetons.
Produit OrdinaireProgrammationIntelligence artificielleModèle linguistique
MiniMax-01 est un puissant modèle linguistique doté de 456 milliards de paramètres, chaque jeton activant 45,9 milliards de paramètres. Il adopte une architecture hybride, combinant l'attention éclair, l'attention softmax et le mélange d'experts (MoE), et étend la longueur du contexte d'entraînement à 1 million de jetons grâce à des stratégies de parallélisation avancées et des méthodes innovantes de chevauchement calcul-communication, telles que LASP+ (Linear Attention Sequence Parallelism+), l'attention circulaire varlen et ETP (Expert Tensor Parallelism). Lors de l'inférence, il peut traiter un contexte allant jusqu'à 4 millions de jetons. MiniMax-01 a démontré des performances de premier ordre dans plusieurs tests de référence académiques.
MiniMax-01 Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34