Llama-3 8B Instruct 262k

Modelo de geração de texto de alto desempenho desenvolvido pela equipe Gradient AI.

Produto ComumProdutividadeGeração de TextoProcessamento de Texto Longo
Llama-3 8B Instruct 262k é um modelo de geração de texto desenvolvido pela equipe Gradient AI. Ele estende o comprimento do contexto do Llama-3 8B para mais de 160K, demonstrando o potencial de modelos de linguagem de grande porte (SOTA - State of the Art) no aprendizado de operações com textos longos. O modelo alcança esse aprendizado eficiente em textos longos por meio de ajustes apropriados do parâmetro RoPE theta, combinados com interpolação NTK-aware e técnicas de otimização orientadas por dados. Além disso, ele é construído com base na biblioteca EasyContext Blockwise RingAttention, para permitir treinamento escalável e eficiente em hardware de alto desempenho.
Abrir Site

Llama-3 8B Instruct 262k Situação do Tráfego Mais Recente

Total de Visitas Mensais

29742941

Taxa de Rejeição

44.20%

Média de Páginas por Visita

5.9

Duração Média da Visita

00:04:44

Llama-3 8B Instruct 262k Tendência de Visitas

Llama-3 8B Instruct 262k Distribuição Geográfica das Visitas

Llama-3 8B Instruct 262k Fontes de Tráfego

Llama-3 8B Instruct 262k Alternativas