AiShi Technology hat kürzlich sein Video-Generierungsprodukt PixVerse V2 veröffentlicht. Dies ist ein innovatives Werkzeug, das auf einem großen KI-Videomodell basiert und Nutzern helfen soll, ihr kreatives Potenzial zu entfalten. PixVerse V2 verwendet die Diffusion+Transformer (DiT)-Grundarchitektur und bietet mehrere technische Innovationen, die die Videogenerierung flüssiger, konsistenter und interessanter machen.

微信截图_20240725084918.png

Hauptmerkmale:

  • Raum-Zeit-Aufmerksamkeitsmechanismus: PixVerse V2 führt einen selbst entwickelten Raum-Zeit-Aufmerksamkeitsmechanismus ein, der die Wahrnehmung von Raum und Zeit verbessert und insbesondere bei der Verarbeitung komplexer Szenen hervorragende Ergebnisse liefert.

  • Textverständnisfähigkeit: Durch ein multimodales Modell kann PixVerse V2 Text- und Videoinformationen präziser aufeinander abstimmen, wodurch die Verständnis- und Ausdrucksfähigkeit des Modells verbessert wird.

  • Optimiertes Modelltraining: Basierend auf traditionellen Flow-Modellen fördert PixVerse V2 durch gewichtete Verluste eine schnellere und bessere Konvergenz des Modells und verbessert die gesamte Trainingseffizienz.

  • Videogenerierungsfähigkeit: PixVerse V2 unterstützt die Generierung mehrerer Videoclips gleichzeitig. Einzelne Clips können bis zu 8 Sekunden lang sein, mehrere Clips bis zu 40 Sekunden, wobei die Konsistenz zwischen den Clips erhalten bleibt.

  • Benutzerfreundliche Funktionen: PixVerse V2 unterstützt die Generierung von 1 bis 5 aufeinanderfolgenden Videoclips mit einem Klick, wobei die Konsistenz von Hauptfigur, Stil und Szenenelementen zwischen den Clips erhalten bleibt. Darüber hinaus können Benutzer die Ergebnisse nachbearbeiten und den Videoclip flexibel anpassen und ersetzen.

Das AiShi Technology-Team plant, in den nächsten drei Monaten mehrere iterative Upgrades durchzuführen, um ein besseres Erlebnis bei der KI-Videogenerierung zu bieten. Das Ziel von PixVerse V2 ist es, die Erstellung von KI-Videos einfacher und effizienter zu gestalten, egal ob es sich um die Aufzeichnung des täglichen Lebens oder das Erzählen von Videogeschichten handelt.