C3PO

基于用户反馈的 LLM 模型对齐技术

普通产品生产力LLM 模型用户反馈
C3PO 是一种基于用户反馈的 LLM 模型对齐技术,可以从单个反馈句子中对 LLM 进行调整,避免过度概括化。该技术提供了参考实现、相关基准线和必要组件,方便研究论文中提出的技术。
打开网站

C3PO 替代品