AIbase
Biblioteca de productosNavegación de herramientas

RLHF-Reward-Modeling

Public

Recipes to train reward model for RLHF.

Hora de creación2024-03-21T13:13:27
Hora de actualización2025-03-26T23:15:03
https://rlhflow.github.io/
1.3K
Stars
3
Stars Increase