mwp_ReFT

Marco de ajuste fino de modelos basado en el aprendizaje por refuerzo profundo

Producto ComúnProgramaciónProcesamiento del lenguaje naturalAprendizaje profundo
ReFT es un proyecto de investigación de código abierto que busca ajustar modelos de lenguaje grandes mediante técnicas de aprendizaje por refuerzo profundo para mejorar su rendimiento en tareas específicas. El proyecto proporciona código y datos detallados para que investigadores y desarrolladores puedan reproducir los resultados del artículo. Las principales ventajas de ReFT incluyen la capacidad de ajustar automáticamente los parámetros del modelo utilizando el aprendizaje por refuerzo y la mejora del rendimiento del modelo en tareas específicas a través del ajuste fino. ReFT se basa en los modelos Codellama y Galactica y está licenciado bajo Apache 2.0.
Abrir sitio web

mwp_ReFT Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

mwp_ReFT Tendencia de visitas

mwp_ReFT Distribución geográfica de las visitas

mwp_ReFT Fuentes de tráfico

mwp_ReFT Alternativas