CausVid ist ein fortschrittliches Videogenerierungsmodell, das durch die Anpassung eines vortrainierten bidirektionalen Diffusions-Transformators an einen kausalen Transformator die Echtzeitgenerierung von Videobildern ermöglicht. Die Bedeutung dieser Technologie liegt in der deutlich reduzierten Verzögerung bei der Videogenerierung, sodass die Videogenerierung mit interaktiver Bildrate (9,4 FPS) auf einer einzelnen GPU im Streaming-Modus erfolgen kann. CausVid unterstützt die Text-zu-Video-Generierung sowie die Null-Shot-Generierung von Bild zu Video und repräsentiert einen neuen Höhepunkt in der Videogenerierungstechnologie.