DCLM

Marco integral para la construcción y el entrenamiento de modelos lingüísticos de gran tamaño

Nuevo Producto PremiumProgramaciónModelos lingüísticos de gran tamañoConstrucción de conjuntos de datos
DataComp-LM (DCLM) es un marco integral diseñado para la construcción y el entrenamiento de modelos lingüísticos de gran tamaño (LLM). Ofrece un corpus estandarizado, recetas de preentrenamiento eficientes basadas en el marco open_lm, y más de 50 métodos de evaluación. DCLM permite a los investigadores experimentar con diferentes estrategias de construcción de conjuntos de datos en diversas escalas computacionales, desde modelos de 411M hasta 7B parámetros. DCLM mejora significativamente el rendimiento del modelo mediante el diseño optimizado de conjuntos de datos y ha contribuido a la creación de varios conjuntos de datos de alta calidad que ofrecen un rendimiento superior en diferentes escalas, superando a todos los conjuntos de datos abiertos.
Abrir sitio web

DCLM Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

DCLM Tendencia de visitas

DCLM Distribución geográfica de las visitas

DCLM Fuentes de tráfico

DCLM Alternativas