Skywork-Reward-Gemma-2-27B
Gemma-2-27Bアーキテクチャに基づく高度な報酬モデル
一般製品プログラミング報酬モデル選好処理
Skywork-Reward-Gemma-2-27Bは、Gemma-2-27Bアーキテクチャに基づく高度な報酬モデルであり、複雑な状況における選好処理のために設計されています。このモデルは、数学、プログラミング、セキュリティなど複数の分野から収集された8万件の高品質な選好対データを用いてトレーニングされています。2024年9月のRewardBenchランキングで1位を獲得し、選好処理における優れた能力を実証しています。
Skywork-Reward-Gemma-2-27B 最新のトラフィック状況
月間総訪問数
29742941
直帰率
44.20%
平均ページ/訪問
5.9
平均訪問時間
00:04:44