Light-R1
Light-R1 es un proyecto de código abierto centrado en el razonamiento de cadenas largas (Long COT), que proporciona un método de entrenamiento desde cero mediante SFT, DPO y RL.
Light-R1 Situación del tráfico más reciente
Total de visitas mensuales
521149929
Tasa de rebote
35.96%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:29