Search-R1
Ein effizientes Reinforcement-Learning-Framework zum Trainieren von Sprachmodellen (LLMs), die Inferenz und den Aufruf von Suchmaschinen durchführen.
Search-R1 Neueste Verkehrssituation
Monatliche Gesamtbesuche
521149929
Absprungrate
35.96%
Durchschnittliche Seiten pro Besuch
6.1
Durchschnittliche Besuchsdauer
00:06:29