Extensor de Contexto LLM
Expande a janela de contexto do LLM
Produto ComumProdutividadeLLMModelo de Linguagem
O Extensor de Contexto LLM é uma ferramenta projetada para expandir a janela de contexto de modelos de linguagem grandes (LLMs). Ele faz isso ajustando a frequência base do RoPE e escalonando os logits de atenção, ajudando os LLMs a se adaptarem eficazmente a janelas de contexto maiores. A ferramenta validou a superioridade de seu método em termos de desempenho e robustez de ajuste fino, demonstrando uma eficiência notável ao expandir a janela de contexto do LLaMA-2-7B-Chat para 16.384 com apenas 100 amostras e 6 etapas de treinamento. Além disso, explorou-se como a composição dos dados e o currículo de treinamento afetam a expansão da janela de contexto para tarefas específicas a jusante, sugerindo o ajuste fino de LLMs com longas conversas como um bom ponto de partida.
Extensor de Contexto LLM Situação do Tráfego Mais Recente
Total de Visitas Mensais
29742941
Taxa de Rejeição
44.20%
Média de Páginas por Visita
5.9
Duração Média da Visita
00:04:44