Gestern Abend veröffentlichte Stability AI sein leistungsstärkstes Modell – Stable Diffusion 3.5. Dies ist nicht nur ein einzelnes Modell, sondern ein komplettes Paket mit drei Versionen, die auf die vielfältigen Bedürfnisse von Forschern, Hobbyisten, Start-ups und Unternehmen zugeschnitten sind.
Die drei Versionen sind Stable Diffusion 3.5 Large, Stable Diffusion 3.5 Large Turbo und Stable Diffusion 3.5 Medium, das am 29. Oktober veröffentlicht wird.
Stable Diffusion 3.5 Large ist ein Basismodell mit 8 Milliarden Parametern, das sich durch seine hervorragende Bildqualität und präzise Prompt-Verarbeitung auszeichnet. Es eignet sich hervorragend für professionelle Anwendungen und kann Bilder mit einer Auflösung von bis zu 1 Million Pixel generieren.
Stable Diffusion 3.5 Large Turbo ist eine destillierte Version des Vorgängers. Es generiert hochwertige Bilder in nur 4 Schritten und ist deutlich schneller als Stable Diffusion 3.5 Large.
Stable Diffusion 3.5 Medium hingegen verfügt über 2,5 Milliarden Parameter und nutzt die verbesserte MMDiT-X-Architektur und Trainingsmethoden. Es ist sofort einsatzbereit, läuft auf Consumer-Hardware und bietet einen ausgewogenen Kompromiss zwischen Bildqualität und Anpassbarkeit. Es generiert Bilder mit einer Auflösung zwischen 0,25 und 2 Millionen Pixel.
Bei der Entwicklung dieser Modelle wurde die Anpassbarkeit priorisiert. Durch die Integration der Query-Key-Normalisierung in die Transformer-Blöcke wurde der Trainingsprozess stabilisiert und die Feinabstimmung sowie die Weiterentwicklung vereinfacht. Um die Flexibilität für nachgelagerte Aufgaben zu gewährleisten, behält Stability AI eine breite Wissensbasis und diverse Stile im Modell bei, was jedoch zu einer erhöhten Unsicherheit der Ergebnisse führen kann.
Die Stable Diffusion 3.5 Modelle zeichnen sich durch Anpassbarkeit, effiziente Leistung und vielfältige Ausgaben aus. Sie lassen sich leicht an spezifische kreative Anforderungen anpassen oder in Anwendungen für individuelle Workflows integrieren. Sie sind außerdem für den Betrieb auf Standard-Consumer-Hardware optimiert und benötigen keine übermäßige Rechenleistung. Darüber hinaus können diese Modelle Bilder erstellen, die die ganze Welt repräsentieren, ohne umfangreiche Prompts zu benötigen, und verschiedene Stile und Ästhetiken wie 3D, Fotografie, Malerei, Linienkunst und nahezu jeden erdenklichen visuellen Stil generieren.
Stability AI betont auch sein Engagement für Sicherheit und hat angemessene Maßnahmen ergriffen, um den Missbrauch von Stable Diffusion 3.5 zu verhindern, wobei die Integrität von Anfang an im Mittelpunkt stand. Darüber hinaus ist die Stability AI Community-Lizenz sehr großzügig und erlaubt Einzelpersonen und Organisationen die kostenlose Nutzung des Modells für nicht-kommerzielle Zwecke, einschließlich wissenschaftlicher Forschung. Start-ups, KMUs und Kreative mit einem Jahresumsatz von unter 1 Million US-Dollar können das Modell auch kostenlos für kommerzielle Zwecke nutzen. Die Eigentumsrechte an den generierten Medien bleiben bestehen, ohne Einschränkungen durch restriktive Lizenzen.
Die Stable Diffusion 3.5 Modelle sind bereits auf Hugging Face für das Self-Hosting verfügbar, und der Inferenzcode ist Open Source. Das Modell ist außerdem über Plattformen wie die Stability AI API, Replicate, ComfyUI und DeepInfra zugänglich.
Testversion:https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large