Parrot
多目标强化学习框架,文本转图像生成
普通产品图像强化学习文本生成
Parrot 是一种多目标强化学习框架,专为文本转图像生成而设计。它通过批量 Pareto 最优选择的方式,自动识别在 T2I 生成的 RL 优化过程中不同奖励之间的最佳权衡。此外,Parrot采用了 T2I 模型和提示扩展网络的联合优化方法,促进了生成质量感知的文本提示,从而进一步提高了最终图像质量。为了抵消由于提示扩展而可能导致的原始用户提示的潜在灾难性遗忘,我们在推理时引入了原始提示中心化指导,确保生成的图像忠实于用户输入。大量实验和用户研究表明,Parrot在各种质量标准,包括美学、人类偏好、图像情感和文本-图像对齐方面,均优于几种基线方法。
Parrot 最新流量情况
月总访问量
19075321
跳出率
45.07%
平均页面访问数
5.5
平均访问时长
00:05:32