Skywork-Reward-Llama-3.1-8B
テキスト分類と選好判断のための高度な報酬モデル
一般製品プログラミング機械学習自然言語処理
Skywork-Reward-Llama-3.1-8Bは、Meta-Llama-3.1-8B-Instructアーキテクチャをベースとした高度な報酬モデルです。Skywork Reward Data Collectionを使用してトレーニングされており、このデータセットには8万件の高品質な選好ペアが含まれています。複雑な状況における選好処理、特に困難な選好ペアにおいて優れたパフォーマンスを示し、数学、プログラミング、セキュリティなど複数の分野を網羅しています。2024年9月現在、RewardBenchランキングで3位にランクインしています。
Skywork-Reward-Llama-3.1-8B 最新のトラフィック状況
月間総訪問数
29742941
直帰率
44.20%
平均ページ/訪問
5.9
平均訪問時間
00:04:44