OLMo-2-1124-13B-DPO

Modelo de lenguaje de alto rendimiento en inglés, adecuado para diversas tareas.

Producto ComúnProgramaciónModelo de lenguajeProcesamiento del lenguaje natural

OLMo-2-1124-13B-DPO es un modelo de lenguaje grande de 13B parámetros entrenado con ajuste supervisado y DPO, principalmente para inglés, diseñado para ofrecer un rendimiento excepcional en diversas tareas como chat, matemáticas, GSM8K e IFEval. Este modelo forma parte de la serie OLMo, cuyo objetivo es impulsar la investigación científica en modelos de lenguaje. El entrenamiento del modelo se basa en el conjunto de datos Dolma, y se proporciona públicamente el código, los puntos de control, los registros y los detalles del entrenamiento.

Best AI Websites & Tools

OLMo-2-1124-13B-DPO

OLMo-2-1124-13B-DPO Situación del tráfico más reciente

OLMo-2-1124-13B-DPO Tendencia de visitas

OLMo-2-1124-13B-DPO Distribución geográfica de las visitas

OLMo-2-1124-13B-DPO Fuentes de tráfico

OLMo-2-1124-13B-DPO Alternativas

OLMo-2-1124-13B-DPO — Modelo de lenguaje de alto rendimiento en inglés, adecuado para diversas tareas.

Xwen-Chat — Xwen-Chat es un conjunto de modelos de lenguaje grande enfocados en la conversación en chino, que ofrece modelos de varias versiones y servicios de generación de lenguaje.

OLMo-2-1124-7B-RM — Modelo de lenguaje grande para generación y clasificación de texto

OLMo 2 — Modelo de lenguaje completamente abierto de última generación

Qwen Turbo 1M Demo — Qwen Turbo 1M Demo es un espacio de Hugging Face proporcionado por Qwen.

Fugaku-LLM — Fugaku-LLM es un modelo de inteligencia artificial centrado en la generación de texto.

MAP-NEO — Un modelo de lenguaje grande completamente de código abierto que ofrece capacidades avanzadas de procesamiento del lenguaje natural.

Instella — Instella es un modelo de lenguaje de código abierto de alto rendimiento desarrollado por AMD, diseñado para acelerar el desarrollo de modelos de lenguaje de código abierto.

MiniMax-01 — Potente modelo de lenguaje con 4560 mil millones de parámetros totales, capaz de procesar contextos de hasta 4 millones de tokens.

Sonus-1 — Sonus-1: Inaugurando una nueva era para los modelos de lenguaje grandes (LLM)

Llama-3.1-70B-Instruct-AWQ-INT4 — Modelo de generación de texto con 70 mil millones de parámetros

Llama-lynx-70b-4bitAWQ — Modelo de generación de texto de 7000 millones de parámetros

CosyVoice Generación de Voz Modelo grande 2.0-0.5B — Modelo de síntesis de voz eficiente y multilingüe

OLMo-2-1124-7B-SFT — Modelo de generación de texto en inglés de alto rendimiento

OLMo-2-1124-7B-DPO — Modelo avanzado de generación de texto que admite el procesamiento de diversas tareas.

ProactiveAgent — Agente proactivo basado en modelos lingüísticos de gran tamaño (LLM), que predice las necesidades del usuario y ofrece ayuda de forma proactiva.

OpenScholar — Modelo de lenguaje aumentado por búsqueda para la síntesis de literatura científica

dolmino-mix-1124 — Conjunto de datos de alta calidad para la segunda etapa de entrenamiento de OLMo2.

OLMo-2-1124-13B-Instruct — Modelo de lenguaje grande optimizado para la generación de texto y la conversación.

Llama-3.1-Tulu-3-8B-DPO — Modelo avanzado de generación de texto, compatible con diversas tareas

Llama-3.1-Tulu-3-70B — Familia líder de modelos que siguen instrucciones, ofreciendo datos, código y guías de código abierto.

Llama-3.1-Tulu-3-8B — Modelo avanzado de seguimiento de instrucciones, con datos y código de fuente abierta.

O1-Journey — O1-Journey: Informe de progreso estratégico - Parte 1

aya-101 — Modelo de lenguaje generativo multilingüe

Aya Expanse 32B — Modelo de lenguaje extenso multilingüe, compatible con 23 idiomas

Zamba2-7B — Modelo de lenguaje pequeño de alto rendimiento

falcon-mamba-7b — Modelo de lenguaje causal de 7B parámetros de alto rendimiento

Muestreo basado en entropía — Técnica de muestreo basada en la entropía, que optimiza la diversidad y la precisión de la salida del modelo.

Generador de oraciones con IA — Herramienta online que utiliza la tecnología de IA para generar oraciones de alta calidad.

AMD-Llama-135m — Modelo de lenguaje de alto rendimiento entrenado por AMD