Skywork-Reward-Llama-3.1-8B

テキスト分類と選好判断のための高度な報酬モデル

一般製品プログラミング機械学習自然言語処理
Skywork-Reward-Llama-3.1-8Bは、Meta-Llama-3.1-8B-Instructアーキテクチャをベースとした高度な報酬モデルです。Skywork Reward Data Collectionを使用してトレーニングされており、このデータセットには8万件の高品質な選好ペアが含まれています。複雑な状況における選好処理、特に困難な選好ペアにおいて優れたパフォーマンスを示し、数学、プログラミング、セキュリティなど複数の分野を網羅しています。2024年9月現在、RewardBenchランキングで3位にランクインしています。
ウェブサイトを開く

Skywork-Reward-Llama-3.1-8B 最新のトラフィック状況

月間総訪問数

29742941

直帰率

44.20%

平均ページ/訪問

5.9

平均訪問時間

00:04:44

Skywork-Reward-Llama-3.1-8B 訪問数の傾向

Skywork-Reward-Llama-3.1-8B 訪問地理的分布

Skywork-Reward-Llama-3.1-8B トラフィックソース

Skywork-Reward-Llama-3.1-8B 代替品