LongLLaMA
Modelo de lenguaje grande para el procesamiento de textos largos
Producto ComúnProgramaciónModelo de lenguajeProcesamiento del lenguaje natural
LongLLaMA es un modelo de lenguaje grande capaz de procesar textos extensos. Se basa en OpenLLaMA y se ha ajustado finamente utilizando el método Focused Transformer (FoT). Puede procesar textos de hasta 256 000 tokens o incluso más. Ofrecemos un modelo base más pequeño de 3B (sin ajuste de instrucciones) y código de inferencia en Hugging Face que admite contextos más largos. Nuestros pesos de modelo pueden utilizarse como sustitutos de LLaMA en implementaciones existentes (aplicable a contextos cortos de hasta 2048 tokens). Además, proporcionamos los resultados de la evaluación y una comparación con el modelo OpenLLaMA original.
LongLLaMA Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34