LongLLaMA

Modelo de lenguaje grande para el procesamiento de textos largos

Producto ComúnProgramaciónModelo de lenguajeProcesamiento del lenguaje natural

LongLLaMA es un modelo de lenguaje grande capaz de procesar textos extensos. Se basa en OpenLLaMA y se ha ajustado finamente utilizando el método Focused Transformer (FoT). Puede procesar textos de hasta 256 000 tokens o incluso más. Ofrecemos un modelo base más pequeño de 3B (sin ajuste de instrucciones) y código de inferencia en Hugging Face que admite contextos más largos. Nuestros pesos de modelo pueden utilizarse como sustitutos de LLaMA en implementaciones existentes (aplicable a contextos cortos de hasta 2048 tokens). Además, proporcionamos los resultados de la evaluación y una comparación con el modelo OpenLLaMA original.

Best AI Websites & Tools

LongLLaMA

LongLLaMA Situación del tráfico más reciente

LongLLaMA Tendencia de visitas

LongLLaMA Distribución geográfica de las visitas

LongLLaMA Fuentes de tráfico

LongLLaMA Alternativas

LongLLaMA — Modelo de lenguaje grande para el procesamiento de textos largos

Instella — Instella es un modelo de lenguaje de código abierto de alto rendimiento desarrollado por AMD, diseñado para acelerar el desarrollo de modelos de lenguaje de código abierto.

Xwen-Chat — Xwen-Chat es un conjunto de modelos de lenguaje grande enfocados en la conversación en chino, que ofrece modelos de varias versiones y servicios de generación de lenguaje.

MiniMax-01 — Potente modelo de lenguaje con 4560 mil millones de parámetros totales, capaz de procesar contextos de hasta 4 millones de tokens.

YuLan-Mini — Un modelo de lenguaje ligero y de alta eficiencia con 240 millones de parámetros.

OLMo-2-1124-13B-DPO — Modelo de lenguaje de alto rendimiento en inglés, adecuado para diversas tareas.

OpenScholar — Modelo de lenguaje aumentado por búsqueda para la síntesis de literatura científica

OLMo 2 13B — Modelo de lenguaje de referencia académica en inglés de alto rendimiento

OLMo 2 — Modelo de lenguaje completamente abierto de última generación

MobileLLM-1B — Modelo de lenguaje de Meta con menos de mil millones de parámetros, diseñado para aplicaciones en dispositivos móviles.

MobileLLM-350M — Modelo de lenguaje de parámetros sub-mil millones eficientemente optimizado, diseñado para aplicaciones en dispositivos.

Zamba2-7B — Modelo de lenguaje pequeño de alto rendimiento

Chatea con tus Documentos — Aplicación Python para conversar con documentos en lenguaje natural

Meta Llama 3.1-405B — Modelo de lenguaje grande preentrenado multilingüe

Arcee Spark — Modelo de lenguaje eficiente y compacto de 7B parámetros

Predicción de múltiples tokens — Modelo de predicción de múltiples tokens que mejora la eficiencia y el rendimiento de los modelos de lenguaje.

MDLM — Un modelo de lenguaje de difusión enmascarada altamente eficiente.

Samba — Implementación oficial de un modelo de lenguaje eficiente con contexto ilimitado

MAP-NEO — Un modelo de lenguaje grande completamente de código abierto que ofrece capacidades avanzadas de procesamiento del lenguaje natural.

Modelo de Lenguaje Confiable (MLC) — Prueba el Modelo de Lenguaje Confiable (MLC) de Cleanlab en tu navegador.

OpenELM — OpenELM es una familia eficiente de modelos de lenguaje con un marco de entrenamiento e inferencia de código abierto.

LaVague — LaVague es un framework de modelos de acciones a gran escala para automatizar la interacción con el navegador.

Twitter-Insight-LLM — Modelo de lenguaje grande para análisis de Twitter

H2O-Danube-1.8B — Modelo de lenguaje de 1.8B parámetros, de código abierto y gratuito

Baichuan 3 — Modelo de lenguaje extenso con más de cientos de miles de millones de parámetros

MaLA-500 — Modelo de lenguaje grande que abarca 534 idiomas

Wiseses IA — Plataforma inteligente de creación de contenido

TinyGPT-V — Modelo de lenguaje grande multimodal y eficiente

intfloat/e5-mistral-7b-instruct — Mejora de incrustaciones de texto mediante modelos de lenguaje extenso

PixelLLM — Modelo de lenguaje alineado a píxeles