Eine neue Methode namens Flash Diffusion hat in der jüngsten Forschung einen revolutionären Durchbruch in der Bildgenerierungstechnologie erzielt. Diese Methode beschleunigt den Generierungsprozess von vortrainierten Diffusionsmodellen, indem sie ein Vorhersagemodell trainiert, das in einem einzigen Schritt die entrauschten Ergebnisse mehrstufiger Vorhersagen generiert.

image.png

Produktzugang: https://top.aibase.com/tool/flash-diffusion

Die Forscher berichten, dass Flash Diffusion nicht nur state-of-the-art FID- und CLIP-Score-Ergebnisse bei der Bildgenerierung mit wenigen Schritten erzielt, sondern auch weniger GPU-Zeit und weniger trainierbare Parameter im Training benötigt als bestehende Methoden. Darüber hinaus zeigt die Methode Effizienz und Vielseitigkeit in verschiedenen Aufgaben wie Text-zu-Bild, Inpainting, Face Swapping und Super-Resolution.

Die Forscher betonen, dass die Innovation von Flash Diffusion in der Verwendung einer anpassbaren Verteilung zur Auswahl der Zeitschritte liegt, wodurch das Vorhersagemodell besser in der Lage ist, spezifische Zeitschritte zu lokalisieren. Zusätzlich wird ein gegnerisches Ziel verwendet, indem ein Diskriminator trainiert wird, um generierte Stichproben von echten Stichproben zu unterscheiden, und dies wird im latenten Raum angewendet, um den Rechenaufwand zu reduzieren. Gleichzeitig verwendet das Forschungsteam einen verteilungsabgleichenden Destillationsverlust, um sicherzustellen, dass die generierten Stichproben der vom Vorhersagemodell erlernten Datenverteilung sehr ähnlich sind.

image.png

Darüber hinaus demonstrieren die Forscher die Fähigkeit von Flash Diffusion, sich an verschiedene Basisnetzwerke anzupassen, darunter UNet-basierte Entrauser (SD1.5, SDXL) und DiT (Pixart-α), sowie Adapter. In mehreren Beispielen reduziert die Methode die Anzahl der Sampling-Schritte deutlich, während gleichzeitig die hohe Qualität der Bildgenerierung erhalten bleibt.

Flash Diffusion verleiht der Bildgenerierungstechnologie neuen Schwung und verbessert die Effizienz und Vielseitigkeit des Generierungsprozesses erheblich. Diese bahnbrechende Methode dürfte weitreichende Auswirkungen auf verschiedene Bereiche haben und neue Chancen und Herausforderungen für die Forschung in diesem Bereich schaffen.