Das mit Spannung erwartete Bildgenerierungs-Großmodell Step-1X wurde kürzlich von Jieyue Xingchen in seinem Open-Platform-Erlebniszentrum offiziell vorgestellt. Die Nutzung ist nach der Registrierung möglich.
Das Großmodell wurde erstmals auf der Weltkonferenz für künstliche Intelligenz 2024 präsentiert, zusammen mit dem Sprach-Großmodell Step-2 mit Billionen Parametern und dem multimodalen Großmodell Step-1.5V.
Step-1X, in Zusammenarbeit mit Shanghai Film entwickelt, bietet in Kooperation mit dem klassischen IP „Die Affenkönige“ ein interaktives H5-Erlebnis: „Finde heraus, welcher Gott du bist“. Trotz der knappen Datenressourcen von „Die Affenkönige“ erzeugt Step-1X unter diesen Bedingungen Bilder von hoher Qualität.
Step-1X legt Wert auf tiefe semantische Übereinstimmung und detaillierte Generierung. Es verwendet die selbst entwickelte DiT-Modellarchitektur (Diffusion Models with Transformer), versteht komplexe Anweisungen präzise und unterstützt Bildgenerierungsanweisungen mit bis zu 2000 Zeichen.
Seine Flexibilität macht es für vielfältige Anwendungen geeignet, darunter Werbung, Spielegrafik und Filmherstellung. Besonders bei der Verarbeitung chinesischer Elemente und Kultur zeigt Step-1X einzigartige Vorteile und vermittelt den kulturellen Kern auf besonders überzeugende Weise.
Testlink: https://platform.stepfun.com/console-tools?model=step-1x-medium