DiffusionRL

大规模强化学习用于扩散模型

普通产品生产力深度学习图像生成

Text-to-image扩散模型是一类深度生成模型，展现了出色的图像生成能力。然而，这些模型容易受到来自网页规模的文本-图像训练对的隐含偏见的影响，可能无法准确地对我们关心的图像方面进行建模。这可能导致次优样本、模型偏见以及与人类伦理和偏好不符的图像。本文介绍了一种有效可扩展的算法，利用强化学习（RL）改进扩散模型，涵盖了多样的奖励函数，如人类偏好、组成性和公平性，覆盖了数百万张图像。我们阐明了我们的方法如何大幅优于现有方法，使扩散模型与人类偏好保持一致。我们进一步阐明了如何这显著改进了预训练的稳定扩散（SD）模型，生成的样本被人类偏好80.3%，同时改善了生成样本的组成和多样性。

Best AI Websites & Tools

DiffusionRL

DiffusionRL 最新流量情况

DiffusionRL 访问量趋势

DiffusionRL 访问地理位置分布

DiffusionRL 流量来源

DiffusionRL 替代品

DeepMind — 谷歌旗下领先的人工智能研究公司

DiffusionRL — 大规模强化学习用于扩散模型

CogView4-6B — CogView4-6B 是一个强大的文本到图像生成模型，专注于高质量图像生成。

VLM-R1 — VLM-R1 是一个稳定且通用的强化视觉语言模型，专注于视觉理解任务。

Janus-Pro-7B — Janus-Pro-7B 是一个新型的自回归框架，统一多模态理解和生成。

Janus-Pro-1B — Janus-Pro-1B 是一个统一多模态理解和生成的自回归框架。

Flex.1-alpha — 一个基于文本生成图像的预训练模型，具有80亿参数和Apache 2.0开源许可。

Worlds of Frames — Frames 是 Runway 推出的高级图像生成基础模型，提供前所未有的风格控制和视觉保真度。

TryOffAnyone — 从穿着人身上生成平铺布料的模型

mwp_ReFT — 基于深度强化学习的模型微调框架

BooW-VTON — 提升户外虚拟试穿效果的模型训练代码库

ControlNets for Stable Diffusion 3.5 Large — Stable Diffusion 3.5 Large的三款ControlNets模型

OminiControl — FLUX.1的最小且通用的控制器

Qwen2vl-Flux — 先进的多模态图像生成模型，结合文本提示和视觉参考生成高质量图像。

FLUX.1-dev LoRA Outfit Generator — 基于文本生成服装图像的AI模型

IC-Light V2 — 基于Flux的IC-Light模型，专注于图像细节保留和风格化处理

sd3.5 — 轻量级推理模型，用于生成高质量图像

Stable Diffusion 3.5 — 强大的图像生成模型

RealAnime — 基于Stable Diffusion的LoRA模型，生成逼真动漫风格图像

CogView3-Plus-3B — 文本到图像生成模型，支持高分辨率图像生成

Omni-Zero-Couples — 零样本风格化情侣肖像创作

Open-MAGVIT2 — 开源自回归视觉生成模型项目

GenWarp — 生成新视角的图像，保持语义信息。

DiffusionKit — 在苹果硅片上运行扩散模型的推理工具。

AuraFlow v0.3 — 开源文本到图像生成模型

x-flux — 深度学习模型训练脚本集

SD3-Controlnet-Canny — 一种用于生成图像的深度学习模型。

SDXL Flash — 高效能的文本到图像生成模型

FaceChain — 深度学习工具链，用于生成你的数字孪生体。

GenAI Courses — AI学习平台