Am 22. Januar 2025 gab die Shanghai Jieyue Xingchen Intelligent Technology Co., Ltd. die offizielle Aktualisierung ihres Videogenerierungsmodells Step-Video auf Version V2 bekannt. Dieses Upgrade bringt erhebliche technologische Durchbrüche und Funktionsverbesserungen mit sich, wodurch es in der Simulation der realen Welt noch leistungsfähiger wird.
Step-Video V2 wurde in mehreren Kernbereichen optimiert und innovativ weiterentwickelt. Erstens verwendet diese Version ein VAE-Modell mit höherer Kompressionsrate. Durch effiziente Komprimierung im Raum und in der Zeit wird bei gleichbleibender Rekonstruktionsqualität die Rechenkomplexität deutlich reduziert und die Generierungsleistung verbessert. Zweitens wurde die DiT-Architektur in Step-Video V2 tiefgreifend optimiert und ein Verstärkungslernverfahren eingeführt, um die Flüssigkeit und Detailgenauigkeit der Videogenerierung weiter zu verbessern. Darüber hinaus kombiniert diese Version ein selbstentwickeltes multimodales Verständnis-Großmodell und eine Videodatenbank, um Videoinhalte und Kamerasprache genauer zu beschreiben und realistischere Videos zu generieren.
In der Praxis zeigt Step-Video V2 beeindruckende Fähigkeiten bei der Generierung komplexer Bewegungen. Ob Ballett, Karate oder Badminton – dynamische Szenen werden flüssig dargestellt. Gleichzeitig zeichnet sich das Modell durch eine hervorragende Erfassung von Gesichtsausdrücken aus und kann die Mimik und Lichtspiele realer oder fiktiver Charaktere detailgetreu wiedergeben. Darüber hinaus unterstützt Step-Video V2 eine reichhaltige Kamerasprache, einschließlich verschiedener Bewegungsarten wie Schwenken, Zoomen, Fahren und Verfolgen sowie Übergänge zwischen verschiedenen Perspektiven, was den Videoerstellern mehr Möglichkeiten bietet.
Erwähnenswert ist, dass Step-Video V2 eine neue Basisfunktion zur Textgenerierung hinzugefügt hat, die Text auf natürliche Weise in Videoinhalte einfügt. Das Ergebnis ist deutlich besser als bei Vorgängermodellen. Diese Funktion erweitert die Anwendungsszenarien der Videogenerierung erheblich.
Derzeit kann Step-Video V2 über die Yuewen-Webseite (https://yuewen.cn/videos) getestet werden. Benutzer können die verbesserte Funktionalität erleben.
Dieses Upgrade markiert nicht nur einen technologischen Fortschritt von Jieyue Xingchen im Bereich der Videogenerierung, sondern bietet auch den Erstellern leistungsfähigere Werkzeuge und treibt die Videoproduktion in eine neue Phase.