AIbase
Biblioteca de productosNavegación de herramientas

SCoRe

Public

SCoRe: Training Language Models to Self-Correct via Reinforcement Learning

Hora de creación2024-10-06T00:51:09
Hora de actualización2025-02-23T05:26:54
9
Stars
0
Stars Increase

Proyectos relacionados