Samba
Implémentation officielle d'un modèle linguistique efficace à contexte illimité.
Nouveau Produit PremiumProgrammationTraitement du langage naturelApprentissage automatique
Samba est un modèle hybride simple et puissant, doté d'une longueur de contexte illimitée. Son architecture est très simple : Samba = Mamba + MLP + attention à fenêtre glissante + empilement hiérarchique de MLP. Le modèle Samba-3.8B a été entraîné sur 3,2 billions de jetons sur l'ensemble de données Phi3, surpassant largement Phi3-mini sur les principaux benchmarks (tels que MMLU, GSM8K et HumanEval). Samba permet également d'obtenir une capacité de recherche de contexte long avec un réglage minimal des instructions, tout en conservant une complexité linéaire avec la longueur de la séquence. Cela fait de Samba-3.8B-instruct un excellent choix pour les tâches en aval, telles que la synthèse de longs contextes.
Samba Dernière situation du trafic
Nombre total de visites mensuelles
474564576
Taux de rebond
36.20%
Nombre moyen de pages par visite
6.1
Durée moyenne de la visite
00:06:34