Search-R1
Un marco de aprendizaje por refuerzo eficiente para entrenar modelos de lenguaje que realizan razonamiento y llaman a motores de búsqueda.
Search-R1 Situación del tráfico más reciente
Total de visitas mensuales
521149929
Tasa de rebote
35.96%
Páginas promedio por visita
6.1
Duración promedio de la visita
00:06:29