提供12万人真实数据,Prolific想让大模型都能用上RLHF!
4
Prolific 是一个提供真实人类数据的平台,可以帮助 AI 大模型厂商进行 RLHF(人类反馈强化学习)训练。RLHF 结合人类指导和自动强化学习,通过人类评价和指导来优化 AI 的决策能力和输出内容。Prolific 已经建立了一个超过 12 万人的社区,为超过 3000 家知名组织提供高质量数据。他们通过对参与者进行身份验证和过滤器数据搜集任务来保证提供的数据是真实的。Prolific 认为高质量的训练数据对于 AI 大模型来说非常重要,可以减少幻觉、非法输出,增强 RLHF 能力,避免数据纠纷。通过 RLHF,AI 可以在人类监督下快速提升内容的输出能力。Prolific 的数据可以用于各种任务,例如翻译模型可以获得专业翻译人员的建议,使得翻译内容更加自然贴近真实。
source: https://mp.weixin.qq.com/s/CDS0Pvb2JG7mGxzHX5C7TA
© 版权所有 AIbase基地 2024, 点击查看来源出处 - https://www.aibase.com/zh/news/93