LongLLaMA

Modelo de lenguaje grande para el procesamiento de textos largos

Producto ComúnProgramaciónModelo de lenguajeProcesamiento del lenguaje natural
LongLLaMA es un modelo de lenguaje grande capaz de procesar textos extensos. Se basa en OpenLLaMA y se ha ajustado finamente utilizando el método Focused Transformer (FoT). Puede procesar textos de hasta 256 000 tokens o incluso más. Ofrecemos un modelo base más pequeño de 3B (sin ajuste de instrucciones) y código de inferencia en Hugging Face que admite contextos más largos. Nuestros pesos de modelo pueden utilizarse como sustitutos de LLaMA en implementaciones existentes (aplicable a contextos cortos de hasta 2048 tokens). Además, proporcionamos los resultados de la evaluación y una comparación con el modelo OpenLLaMA original.
Abrir sitio web

LongLLaMA Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

LongLLaMA Tendencia de visitas

LongLLaMA Distribución geográfica de las visitas

LongLLaMA Fuentes de tráfico

LongLLaMA Alternativas