Skywork-Reward-Llama-3.1-8B

先进的奖励模型,用于文本分类和偏好判断

普通产品编程机器学习自然语言处理
Skywork-Reward-Llama-3.1-8B是一个基于Meta-Llama-3.1-8B-Instruct架构的先进奖励模型,使用Skywork Reward Data Collection进行训练,该数据集包含80K高质量的偏好对。模型在处理复杂场景中的偏好,包括具有挑战性的偏好对方面表现出色,覆盖数学、编程和安全性等多个领域。截至2024年9月,该模型在RewardBench排行榜上位列第三。
打开网站

Skywork-Reward-Llama-3.1-8B 最新流量情况

月总访问量

18200568

跳出率

44.11%

平均页面访问数

5.8

平均访问时长

00:05:46

Skywork-Reward-Llama-3.1-8B 访问量趋势

Skywork-Reward-Llama-3.1-8B 访问地理位置分布

Skywork-Reward-Llama-3.1-8B 流量来源

Skywork-Reward-Llama-3.1-8B 替代品