Search-R1は、推論を行い、検索エンジンを呼び出すことができる大規模言語モデル(LLM)をトレーニングすることを目的とした強化学習フレームワークです。veRLをベースに構築されており、様々な強化学習手法と異なるLLMアーキテクチャをサポートしており、ツール拡張推論の研究開発において、効率性と拡張性を備えています。