UniVG
Universelles multimodales Videosystem
Normales ProduktBildVideoerzeugungMultimodal
UniVG ist ein universelles multimodales Videosystem, das verschiedene Videoerzeugungsaufgaben bewältigen kann, darunter Text- und Bildmodalitäten. Durch die Einführung von Multi-Condition-Cross-Attention und verzögertem Gaußschen Rauschen wurde die Erzeugung von Videos mit hoher und niedriger Freiheitsgraden realisiert. Auf dem öffentlichen akademischen Benchmark MSR-VTT wurde die niedrigste Fréchet-Videometrie (FVD) erreicht, womit die Leistung aktueller Open-Source-Methoden in der menschlichen Bewertung übertroffen und die der aktuellen Closed-Source-Methode Gen2 erreicht wurde.
UniVG Neueste Verkehrssituation
Monatliche Gesamtbesuche
29742941
Absprungrate
44.20%
Durchschnittliche Seiten pro Besuch
5.9
Durchschnittliche Besuchsdauer
00:04:44