CogVideoX ist ein Open-Source-Modell zur Videogenerierung, entwickelt von einem Team der Tsinghua-Universität. Es ermöglicht die Erstellung von Videos aus Textbeschreibungen. Es bietet verschiedene Videogenerierungsmodelle, darunter Einsteigermodelle und große Modelle, um unterschiedliche Qualitäts- und Kostenanforderungen zu erfüllen. Das Modell unterstützt verschiedene Genauigkeiten, darunter FP16 und BF16. Es wird empfohlen, dieselbe Genauigkeit wie beim Modelltraining für die Inferenz zu verwenden. CogVideoX-5B eignet sich besonders für Szenarien, in denen hochwertige Videoinhalte generiert werden müssen, wie z. B. für die Filmproduktion, Spieleentwicklung und Werbegestaltung.