rStar
自己と対戦する相互推論によって、小型言語モデルの問題解決能力を向上させます。
一般製品プログラミング機械学習自然言語処理
rStarは、推論プロセスを解法生成と相互検証に分解することで、小型言語モデル(SLM)の推論能力を大幅に向上させる自己対戦相互推論手法です。微調整や高度なモデルを使用することなく、既存の小型言語モデルの性能を向上させます。rStarは、モンテカルロ木探索(MCTS)と人間の推論行動を組み合わせることで、より高品質な推論軌跡を構築し、同様の能力を持つ別のSLMを識別器として用いて、これらの軌跡の正確性を検証します。この手法は複数のSLMで幅広い実験が行われ、多様な推論問題解決における有効性が実証されています。
rStar 最新のトラフィック状況
月間総訪問数
474564576
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:34