AIbase
ProduktbibliothekTool Navigation

ReMax

Public

Code for Paper (ReMax: A Simple, Efficient and Effective Reinforcement Learning Method for Aligning Large Language Models)

Erstellungszeit2023-10-17T13:25:36
Aktualisierungszeit2025-03-21T14:55:02
181
Stars
0
Stars Increase

Verwandte Projekte