Search-R1 ist ein Reinforcement-Learning-Framework, das darauf ausgelegt ist, Sprachmodelle (LLMs) zu trainieren, die Inferenz durchführen und Suchmaschinen aufrufen können. Es basiert auf veRL, unterstützt verschiedene Reinforcement-Learning-Methoden und unterschiedliche LLM-Architekturen und bietet so Effizienz und Skalierbarkeit in der Forschung und Entwicklung der Tool-Augmented Reasoning.