OLMo-2-1124-13B-DPO
Modelo de lenguaje de alto rendimiento en inglés, adecuado para diversas tareas.
Producto ComúnProgramaciónModelo de lenguajeProcesamiento del lenguaje natural
OLMo-2-1124-13B-DPO es un modelo de lenguaje grande de 13B parámetros entrenado con ajuste supervisado y DPO, principalmente para inglés, diseñado para ofrecer un rendimiento excepcional en diversas tareas como chat, matemáticas, GSM8K e IFEval. Este modelo forma parte de la serie OLMo, cuyo objetivo es impulsar la investigación científica en modelos de lenguaje. El entrenamiento del modelo se basa en el conjunto de datos Dolma, y se proporciona públicamente el código, los puntos de control, los registros y los detalles del entrenamiento.
OLMo-2-1124-13B-DPO Situación del tráfico más reciente
Total de visitas mensuales
29742941
Tasa de rebote
44.20%
Páginas promedio por visita
5.9
Duración promedio de la visita
00:04:44