DiffusionRL

Apprentissage par renforcement à grande échelle pour les modèles de diffusion

Produit OrdinaireProductivitéApprentissage profondGénération d'images

Les modèles de diffusion texte-image sont une catégorie de modèles génératifs profonds qui affichent des capacités remarquables de génération d'images. Cependant, ces modèles sont sensibles aux biais implicites provenant des paires d'entraînement texte-image à l'échelle du web, et peuvent ne pas modéliser fidèlement les aspects des images qui nous intéressent. Cela peut conduire à des échantillons sous-optimaux, des biais de modèle et des images non conformes à l'éthique et aux préférences humaines. Cet article présente un algorithme efficace et évolutif qui utilise l'apprentissage par renforcement (RL) pour améliorer les modèles de diffusion, en couvrant diverses fonctions de récompense telles que les préférences humaines, la composition et l'équité, sur des millions d'images. Nous montrons comment notre approche surpasse largement les méthodes existantes, alignant les modèles de diffusion sur les préférences humaines. Nous démontrons en outre comment cela améliore considérablement le modèle Stable Diffusion (SD) pré-entraîné, les échantillons générés étant préférés par les humains à 80,3 %, tout en améliorant la composition et la diversité des échantillons générés.

Améliorer les modèles de diffusion
Améliorer les modèles de diffusion à l'aide de l'apprentissage par renforcement
Couvrir diverses fonctions de récompense

Applicable pour améliorer les performances de génération des modèles de diffusion texte-image
en augmentant les préférences humaines
la composition et la diversité des images.

DiffusionRL a amélioré un modèle de diffusion texte-image
augmentant ainsi la qualité de la génération d'images.
DiffusionRL a été appliqué pour améliorer le modèle Stable Diffusion
rendant les échantillons générés plus conformes aux préférences humaines.
L'algorithme d'apprentissage par renforcement de DiffusionRL a amélioré les performances de génération des modèles de diffusion

Ouvrir le site Web

DiffusionRL Dernière situation du trafic

Nombre total de visites mensuelles

20415616

Taux de rebond

44.33%

Nombre moyen de pages par visite

3.1

Durée moyenne de la visite

00:04:06

DiffusionRL Tendance des visites

DiffusionRL Distribution géographique des visites

DiffusionRL Sources de trafic

DiffusionRL Alternatives

DeepMind — Société de recherche en intelligence artificielle de premier plan appartenant à Google

Tendance Mondiale

•Intelligence artificielle•Machine learning

390

DiffusionRL — Apprentissage par renforcement à grande échelle pour les modèles de diffusion

Productivité

Best AI Websites & Tools

DiffusionRL

DiffusionRL Dernière situation du trafic

DiffusionRL Tendance des visites

DiffusionRL Distribution géographique des visites

DiffusionRL Sources de trafic

DiffusionRL Alternatives

DeepMind — Société de recherche en intelligence artificielle de premier plan appartenant à Google

DiffusionRL — Apprentissage par renforcement à grande échelle pour les modèles de diffusion

CogView4-6B — CogView4-6B est un puissant modèle de génération d’images à partir de texte, axé sur la génération d’images de haute qualité.

UniTok — UniTok est un tokeniseur visuel unifié pour la génération et la compréhension d'images.

VLM-R1 — VLM-R1 est un modèle linguistique visuel renforcé stable et polyvalent, axé sur les tâches de compréhension visuelle.

Janus-Pro-7B — Janus-Pro-7B est un nouveau framework autorégressif unifiant la compréhension et la génération multimodales.

Janus-Pro-1B — Janus-Pro-1B est un framework autorégressif unifié de compréhension et de génération multimodale.

Flex.1-alpha — Modèle pré-entraîné de génération d'images à partir de texte, doté de 8 milliards de paramètres et sous licence open source Apache 2.0.

Worlds of Frames — Frames est un modèle de base de génération d'images avancé développé par Runway, offrant un contrôle stylistique inégalé et une fidélité visuelle exceptionnelle.

TryOffAnyone — Modèle de génération de patrons à plat à partir d'images de personnes habillées.

mwp_ReFT — Framework d'ajustement fin des modèles basé sur l'apprentissage par renforcement profond

BooW-VTON — Bibliothèque de code d'entraînement de modèle améliorant les effets d'essayage virtuel en extérieur

OminiControl — Contrôleur minimal et universel pour FLUX.1

Qwen2vl-Flux — Modèle de génération d'images multimodales avancé combinant des invites textuelles et des références visuelles pour générer des images de haute qualité.

Générateur de tenues FLUX.1-dev LoRA — Modèle d'IA générant des images de vêtements à partir de texte

IC-Light V2 — Modèle IC-Light basé sur Flux, axé sur la préservation des détails et le traitement stylisé des images.

CogView3-Plus-3B — Modèle de génération d'images à partir de texte, prenant en charge la génération d'images haute résolution.

Open-MAGVIT2 — Projet de modèle de génération d'images autoregressif open source

GenWarp — Génère des images sous de nouveaux angles de vue, tout en préservant les informations sémantiques.

DiffusionKit — Outil d'inférence de modèles de diffusion fonctionnant sur les puces Apple Silicon.

x-flux — Ensemble de scripts d'entraînement de modèles d'apprentissage profond

SD3-ControlNet-Canny — Modèle d'apprentissage profond pour la génération d'images.

FaceChain — Boîte à outils d'apprentissage profond pour générer votre double numérique.

ControlNet++ — Améliore le contrôle de la génération d'images à partir de texte

img2img-turbo — img2img-turbo est une version améliorée d'img2img, conçue pour des conversions rapides d'image à image.

LaVi-Bridge — Connecte différents modèles linguistiques et modèles de génération d'images pour la génération d'images à partir de texte.

ComfyUI-layerdiffusion — Implémentation de nœuds personnalisés pour Layer Diffusion

Stable Diffusion Web — Générateur d'images IA

OOTDiffusion — OOTDiffusion est un outil open source de simulation d'essayage virtuel de vêtements hautement contrôlable.

ConsiStory — Génération d'images à partir de texte cohérente et sans entraînement supervisé