rStar

自己と対戦する相互推論によって、小型言語モデルの問題解決能力を向上させます。

一般製品プログラミング機械学習自然言語処理
rStarは、推論プロセスを解法生成と相互検証に分解することで、小型言語モデル(SLM)の推論能力を大幅に向上させる自己対戦相互推論手法です。微調整や高度なモデルを使用することなく、既存の小型言語モデルの性能を向上させます。rStarは、モンテカルロ木探索(MCTS)と人間の推論行動を組み合わせることで、より高品質な推論軌跡を構築し、同様の能力を持つ別のSLMを識別器として用いて、これらの軌跡の正確性を検証します。この手法は複数のSLMで幅広い実験が行われ、多様な推論問題解決における有効性が実証されています。
ウェブサイトを開く

rStar 最新のトラフィック状況

月間総訪問数

474564576

直帰率

36.20%

平均ページ/訪問

6.1

平均訪問時間

00:06:34

rStar 訪問数の傾向

rStar 訪問地理的分布

rStar トラフィックソース

rStar 代替品