Une nouvelle méthode révolutionnaire pour la génération d'images, nommée Flash Diffusion, a été présentée dans une récente étude. Cette méthode accélère le processus de génération des modèles de diffusion pré-entraînés en entraînant un modèle prédictif pour générer en une seule étape les résultats de prédictions multi-étapes débruitées.
Accès au produit : https://top.aibase.com/tool/flash-diffusion
Selon les chercheurs, la méthode Flash Diffusion obtient des performances de pointe en termes de FID et de CLIP-Score pour la génération d'images en un faible nombre d'étapes, tout en nécessitant moins de temps GPU et de paramètres entraînables que les méthodes existantes. De plus, elle se montre efficace et polyvalente pour plusieurs tâches, telles que la conversion texte-image, la réparation d'images, l'échange de visage et la sur-résolution.
Les chercheurs soulignent que l'innovation de Flash Diffusion réside dans l'utilisation de distributions ajustables pour sélectionner les pas de temps, ce qui aide le modèle prédictif à mieux cibler un pas de temps spécifique. La méthode utilise également une fonction objective antagoniste en entraînant un discriminateur pour distinguer les échantillons générés des échantillons réels, appliquée à l'espace latent pour réduire les besoins en calcul. L'équipe de recherche a également utilisé une perte de distillation d'appariement de distribution pour garantir que les échantillons générés ressemblent étroitement à la distribution de données apprise par le modèle prédictif.
En outre, les chercheurs ont démontré la capacité de Flash Diffusion à s'adapter à différents réseaux de base, notamment les débruitants basés sur UNet (SD1.5, SDXL) et DiT (Pixart-α), ainsi que les adaptateurs. Dans plusieurs exemples, la méthode a considérablement réduit le nombre d'étapes d'échantillonnage tout en maintenant une haute qualité de génération d'images.
Flash Diffusion apporte un souffle d'air frais à la technologie de génération d'images, améliorant considérablement l'efficacité et la polyvalence du processus de génération. Cette méthode révolutionnaire devrait avoir un impact profond dans divers domaines et offrir de nouvelles opportunités et défis pour la recherche.