DiffusionRL

拡散モデルへの大規模強化学習

一般製品生産性深層学習画像生成

テキストから画像への拡散モデルは、優れた画像生成能力を示す深層生成モデルの一種です。しかし、これらのモデルは、ウェブ規模のテキストと画像の訓練データから暗黙的にバイアスを受けやすく、我々が関心を持つ画像の側面を正確にモデル化できない可能性があります。これは、最適でないサンプル、モデルのバイアス、そして人間の倫理や好みに合わない画像につながる可能性があります。本論文では、強化学習（RL）を用いて拡散モデルを改善する、効率的で拡張性の高いアルゴリズムを紹介し、人間の好み、構成性、公平性など、多様な報酬関数を網羅し、数百万枚の画像を対象としています。本手法が既存の方法を大幅に上回り、拡散モデルを人間の好みに合わせることを明らかにします。さらに、この手法が事前学習済みのStable Diffusion（SD）モデルを大幅に改善し、生成されたサンプルが人間の好みを80.3％満たすとともに、生成サンプルの構成と多様性を向上させることを明らかにします。

Best AI Websites & Tools

DiffusionRL

DiffusionRL 最新のトラフィック状況

DiffusionRL 訪問数の傾向

DiffusionRL 訪問地理的分布

DiffusionRL トラフィックソース

DiffusionRL 代替品

DeepMind — Google傘下の、最先端の人工知能研究企業

DiffusionRL — 拡散モデルへの大規模強化学習

CogView4-6B — CogView4-6Bは、高品質な画像生成に特化した強力なテキストから画像への生成モデルです。

VLM-R1 — VLM-R1は、安定性と汎用性に優れた強化学習に基づくビジュアル言語モデルであり、画像理解タスクに特化しています。

Janus-Pro-7B — Janus-Pro-7Bは、マルチモーダルな理解と生成を統合した、新しい自己回帰フレームワークです。

Janus-Pro-1B — Janus-Pro-1Bは、統一的な多様なモダリティを理解し生成する自己回帰フレームワークです。

Flex.1-alpha — 80億パラメータを持つ、Apache 2.0オープンソースライセンスのテキストから画像を生成する事前学習済みモデルです。

Framesの世界 — Framesは、Runwayが提供する高度な画像生成基盤モデルです。これまでにないレベルのスタイル制御と視覚的忠実度を実現します。

TryOffAnyone — 着用している人物から平面状の布地モデルを生成します。

mwp_ReFT — 深層強化学習に基づくモデル微調整フレームワーク

BooW-VTON — 屋外でのバーチャル試着効果を向上させるモデルトレーニングコードライブラリ

Stable Diffusion 3.5 Large用ControlNets — Stable Diffusion 3.5 Large向けの3種類のControlNetsモデル

OminiControl — FLUX.1向けの最小かつ汎用的なコントローラー

Qwen2vl-Flux — テキストプロンプトと視覚的参照を組み合わせて高品質な画像を生成する、高度なマルチモーダル画像生成モデルです。

FLUX.1-dev LoRA Outfit Generator — テキストから衣服画像を生成するAIモデル

IC-Light V2 — FluxベースのIC-Lightモデル。画像の細部を維持しつつ、スタイリッシュな処理に特化しています。

sd3.5 — 高品質な画像生成のための軽量推理モデル

Stable Diffusion 3.5 — 高性能画像生成モデル

RealAnime — Stable DiffusionベースのLoRAモデルで、リアルなアニメスタイルの画像を生成します。

CogView3-Plus-3B — 高解像度画像生成に対応したテキスト画像生成モデル

Omni-Zero-Couples — ゼロショットスタイル化カップル肖像画生成

Open-MAGVIT2 — オープンソースの自己回帰型画像生成モデルプロジェクト

GenWarp — 新しい視点の画像を生成し、意味情報を維持します。

DiffusionKit — Appleシリコン上で拡散モデルの推論を実行するツールです。

AuraFlow v0.3 — オープンソースのテキストツーイメージ生成モデル

x-flux — 深層学習モデル訓練スクリプト集

SD3-ControlNet-Canny — 画像生成のための深層学習モデルです。

SDXL Flash — 高効率なテキストから画像生成モデル

FaceChain — あなたのデジタルツインを生成するための深層学習ツールチェーン。

生成AIコース — AI学習プラットフォーム