Die Shanghai Jieyue Xingchen Intelligent Technology Co., Ltd. hat kürzlich ein bedeutendes Upgrade ihres Bildgenerierungsmodells Step-1X-Serie angekündigt: die leistungsstärkere Version Step-1X-Medium. Dieses Upgrade bietet in mehreren Bereichen deutliche Verbesserungen: Basierend auf der MMDit-Architektur wurde die Generierungsgeschwindigkeit um über 30 % erhöht. Durch gezieltes Training versteht die neue Version Eingaben besser, weist eine höhere Bild-Text-Konsistenz auf und erzeugt Bilder mit natürlicherer Detailqualität.
Step-1X-Medium bietet die neue Funktion „Bild-zu-Bild“. Benutzer können einfach ein Bild hochladen und einfache Anweisungen geben, um das Originalbild in Details zu verbessern, den Stil zu ändern oder es partiell zu bearbeiten. Darüber hinaus wurde die Fähigkeit zur Erstellung von Inhalten im „China-Stil“ verbessert. Das Modell kann die Ausstrahlung asiatischer Gesichter besser einfangen und eine hochwertigere, detailliertere Bildqualität liefern. Step-1X-Medium unterstützt außerdem die Eingabe von englischen Prompts, um Bilder mit englischen Texten zu generieren.
Das verbesserte Step-1X-Medium soll Kreativen als leistungsstarkes Werkzeug dienen, indem es eingegebene Ideen versteht und präzisere, perfekte Ergebnisse liefert. Die neuen Funktionen von Step-1X-Medium sind über die API-Schnittstelle im „Experience Center“ der Jieyue Xingchen Open Platform verfügbar.
Die neue Version von Step-1X-Medium erreicht ein neues Niveau in der Bildqualität, generiert vielfältigere Szenen und bietet eine höhere Bild-Text-Konsistenz. Es optimiert die Darstellung asiatischer Figuren und meistert mühelos den „China-Stil“, wodurch es für Fans von chinesischen, japanischen und amerikanischen Comics Seiten im jeweiligen Stil erstellen kann. Für Grafikdesigner generiert Step-1X-Medium Werbung, Produktverpackungen und Marketingmaterialien, die zum Markenimage passen und den kulturellen Kern der Marke besser widerspiegeln.
Die neue „Hintergrundbild“-Funktion von Step-1X-Medium ermöglicht es Kreativen, ein Basisbild hochzuladen. Das Modell versteht schnell die Bildstruktur und den Stil und verbessert auf Basis des Originals die Details, verändert den Stil oder bearbeitet Teile präzise. Zusätzlich unterstützt Step-1X-Medium die Funktion der Stilreferenz (SRef)-Generierung. Durch Bereitstellung eines Stilreferenzbildes extrahiert das Modell ästhetische Stile und atmosphärische Merkmale und integriert sie in die Bildgestaltung.
Durch Fortschritte in der KI-Technologie kann Step-1X-Medium nun kurze englische Texte in den Prompts verarbeiten und so Bilder verschönern. Dieses Upgrade verbessert nicht nur die Qualität und Effizienz der Bildgenerierung, sondern bietet Kreativen auch mehr Gestaltungsspielraum und Möglichkeiten.
Testversion: https://platform.stepfun.com/