Light-R1
Light-R1 é um projeto de código aberto focado em raciocínio de cadeia longa (Long COT), fornecendo um método de treinamento do zero por meio de SFT, DPO e RL.
Light-R1 Situação do Tráfego Mais Recente
Total de Visitas Mensais
521149929
Taxa de Rejeição
35.96%
Média de Páginas por Visita
6.1
Duração Média da Visita
00:06:29