DCLM
Marco integral para la construcción y el entrenamiento de modelos lingüísticos de gran tamaño
Nuevo Producto PremiumProgramaciónModelos lingüísticos de gran tamañoConstrucción de conjuntos de datos
DataComp-LM (DCLM) es un marco integral diseñado para la construcción y el entrenamiento de modelos lingüísticos de gran tamaño (LLM). Ofrece un corpus estandarizado, recetas de preentrenamiento eficientes basadas en el marco open_lm, y más de 50 métodos de evaluación. DCLM permite a los investigadores experimentar con diferentes estrategias de construcción de conjuntos de datos en diversas escalas computacionales, desde modelos de 411M hasta 7B parámetros. DCLM mejora significativamente el rendimiento del modelo mediante el diseño optimizado de conjuntos de datos y ha contribuido a la creación de varios conjuntos de datos de alta calidad que ofrecen un rendimiento superior en diferentes escalas, superando a todos los conjuntos de datos abiertos.
DCLM Situación del tráfico más reciente
Total de visitas mensuales
474564576
Tasa de rebote
36.20%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:34