AIbase

RL4LMs

Public

一个模块化的强化学习库,用于根据人类偏好微调语言模型

创建时间2022-08-18T13:29:16
更新时间2025-04-04T23:31:27
https://rl4lms.apps.allenai.org/
2.3K
Stars
1
Stars Increase