Auf seinem OpenDay-Event präsentierte Zhihu AI sein neues KI-Großmodell namens Qingying (Ying), das beliebige Texte in Videos umwandeln kann. Qingying kann auf Basis von Text innerhalb von 30 Sekunden hochpräzise Videos mit einer Auflösung von 1440 x 960 erstellen. Der Nutzer muss lediglich einen Text (Prompt) eingeben und den gewünschten Stil auswählen, z. B. 3D-Cartoon, Schwarzweiß, Ölgemälde, Filmlook usw., um ein Video zu generieren. Qingying ist bereits in der Qingyan App verfügbar und für alle Nutzer zugänglich.

Neben der Text-zu-Video-Funktion unterstützt Qingying auch die Bild-zu-Video-Funktion und bietet neue Möglichkeiten für die Erstellung von Emojis, Werbeanzeigen, Geschichten und Kurzvideos. Gleichzeitig wird auch ein „Fotos zum Leben erwecken“-Miniprogramm auf Basis von Qingying veröffentlicht, mit dem die KI Personen oder Szenen auf alten Fotos zum Leben erwecken kann.

微信截图_20240726105620.png

Die Qingying API ist ebenfalls auf der Big-Model-Plattform bigmodel.cn verfügbar. Unternehmen und Entwickler können die Text-zu-Video- und Bild-zu-Video-Funktionen über die API nutzen. Qingying verwendet eine neuartige DiT-Modellarchitektur, um Videoinformationen effizienter zu komprimieren und Text- und Videoinhalte optimal zu integrieren. Dies verbessert die Befolgung komplexer Anweisungen, die Kohärenz der Inhalte und die Bildgestaltung.

Zhihu AI CEO Zhang Peng erwähnte auf dem Event, dass das zugrunde liegende Videogenerierungsmodell von Qingying CogVideoX ist. Es integriert die drei Dimensionen Text, Zeit und Raum und orientiert sich am Algorithmusdesign von Sora. CogVideoX ist im Vergleich zur Vorgängergeneration um das 6-fache schneller, und zukünftig sollen Videos mit höherer Auflösung und längerer Dauer generiert werden können.

Nutzer können Qingying direkt über den „Qingying-Agenten“ in der Zhihu Qingyan PC/App erleben und ihre Ideen in künstlerische Video-Kreationen umsetzen.

Zugangsadresse: https://top.aibase.com/tool/qingying-ai-shipinshengchengfuwu