Samba
Implementação oficial do modelo de linguagem de contexto infinito e alta eficiência.
Novo Produto PremiumProgramaçãoProcessamento de Linguagem NaturalAprendizado de Máquina
Samba é um modelo híbrido simples e poderoso com comprimento de contexto infinito. Sua arquitetura é bastante simples: Samba = Mamba + MLP + Atenção com Janela Deslizante + Pilha MLP hierárquica. O modelo Samba-3.8B foi treinado em 3,2 trilhões de tokens no conjunto de dados Phi3, superando significativamente o Phi3-mini em benchmarks principais (como MMLU, GSM8K e HumanEval). O Samba também consegue alcançar uma capacidade de recuperação de contexto longo com ajuste de instruções mínimo, mantendo a complexidade linear com o comprimento da sequência. Isso faz com que o Samba-3.8B-instruct se destaque em tarefas downstream, como resumo de contexto longo.
Samba Situação do Tráfego Mais Recente
Total de Visitas Mensais
474564576
Taxa de Rejeição
36.20%
Média de Páginas por Visita
6.1
Duração Média da Visita
00:06:34