Das DeepBeepMeep-Team hat kürzlich auf GitHub Wan2.1GP veröffentlicht, ein für Low-End-GPU-Benutzer optimiertes Videogenerierungsmodell. Das Modell basiert auf Alibabas Wan2.1 und zielt darauf ab, Nutzern ohne leistungsstarke GPUs leistungsstarke Videogenerierungsmöglichkeiten zu bieten. Die Einführung von Wan2.1GP markiert einen wichtigen Fortschritt in der Videogenerierungstechnologie, insbesondere im Bereich Open Source.
Bildquelle: Das Bild wurde mit KI generiert und stammt vom Bildlizenzgeber Midjourney.
Zu den Hauptmerkmalen von Wan2.1GP gehören seine hervorragende Leistung und seine breite Anwendbarkeit. Das Modell übertrifft in mehreren Benchmark-Tests konsequent bestehende Open-Source-Modelle und einige kommerzielle Lösungen und zeigt damit eine starke Wettbewerbsfähigkeit. Darüber hinaus benötigt das T2V-1.3B-Modell nur 8,19 GB VRAM, wodurch es auf nahezu allen Consumer-GPUs lauffähig ist. Mit einer RTX4090-Grafikkarte kann der Benutzer in etwa 4 Minuten ein 5-Sekunden-Video in 480p erstellen, dessen Leistung mit einigen proprietären Modellen vergleichbar ist.
Wan2.1GP unterstützt nicht nur verschiedene Aufgaben wie Text-zu-Video, Bild-zu-Video und Videobearbeitung, sondern ist auch das erste Modell, das gleichzeitig Videos mit chinesischem und englischem Text generieren kann. Dieses Merkmal eröffnet den Benutzern mehr Anwendungsmöglichkeiten. Darüber hinaus verfügt das Modell über einen leistungsstarken Video-Variational-Autoencoder (VAE), der beliebig lange 1080p-Videos effizient kodieren und dekodieren kann, wobei die zeitlichen Informationen vollständig erhalten bleiben. Dies bildet eine solide Grundlage für die Video- und Bilderzeugung.
Um die Benutzerfreundlichkeit zu verbessern, wurde Wan2.1GP in vielerlei Hinsicht optimiert, darunter eine deutliche Reduzierung des Speicher- und VRAM-Bedarfs und die Unterstützung verschiedener Konfigurationen für Geräte unterschiedlicher Leistung. Benutzer können das Tool über einen vereinfachten Installationsprozess schnell in Betrieb nehmen. Mit ständigen Updates erhält Wan2.1GP nach und nach weitere praktische Funktionen wie Tea-Cache-Unterstützung und Verbesserungen der Gradio-Oberfläche, um die Generierungsgeschwindigkeit und Benutzerfreundlichkeit weiter zu steigern.
Projektseite: https://github.com/deepbeepmeep/Wan2GP
Wichtigste Punkte:
👍 Spitzenleistung: Wan2.1GP erzielt in mehreren Benchmark-Tests hervorragende Ergebnisse und übertrifft bestehende Open-Source- und kommerzielle Lösungen.
🖥️ Hohe Kompatibilität: Benötigt nur 8,19 GB VRAM und unterstützt nahezu alle Consumer-GPUs, ideal für Low-End-Benutzer.
📜 Unterstützung mehrerer Aufgaben: Unterstützt verschiedene Generierungsaufgaben wie Text-zu-Video und Bild-zu-Video und kann chinesische und englische Texte generieren.