Extensor de Contexto LLM

Expande a janela de contexto do LLM

Produto ComumProdutividadeLLMModelo de Linguagem
O Extensor de Contexto LLM é uma ferramenta projetada para expandir a janela de contexto de modelos de linguagem grandes (LLMs). Ele faz isso ajustando a frequência base do RoPE e escalonando os logits de atenção, ajudando os LLMs a se adaptarem eficazmente a janelas de contexto maiores. A ferramenta validou a superioridade de seu método em termos de desempenho e robustez de ajuste fino, demonstrando uma eficiência notável ao expandir a janela de contexto do LLaMA-2-7B-Chat para 16.384 com apenas 100 amostras e 6 etapas de treinamento. Além disso, explorou-se como a composição dos dados e o currículo de treinamento afetam a expansão da janela de contexto para tarefas específicas a jusante, sugerindo o ajuste fino de LLMs com longas conversas como um bom ponto de partida.
Abrir Site

Extensor de Contexto LLM Situação do Tráfego Mais Recente

Total de Visitas Mensais

29742941

Taxa de Rejeição

44.20%

Média de Páginas por Visita

5.9

Duração Média da Visita

00:04:44

Extensor de Contexto LLM Tendência de Visitas

Extensor de Contexto LLM Distribuição Geográfica das Visitas

Extensor de Contexto LLM Fontes de Tráfego

Extensor de Contexto LLM Alternativas