Récemment, l'équipe DeepBeepMeep a publié sur GitHub Wan2.1GP, un modèle de génération vidéo optimisé pour les utilisateurs disposant de GPU bas de gamme. Ce modèle, basé sur Wan2.1 d'Alibaba, vise à fournir une puissante capacité de génération vidéo aux utilisateurs ne disposant pas de ressources GPU hautes performances. Le lancement de Wan2.1GP marque une avancée importante dans la technologie de génération vidéo, notamment dans le domaine de l'open source.

Robot tapant au travail 1

Source : Image générée par IA, fournisseur de services d'autorisation d'images Midjourney

Les principales caractéristiques de Wan2.1GP incluent ses performances exceptionnelles et sa grande adaptabilité. Ce modèle surpasse constamment les modèles open source existants et certaines solutions commerciales lors de plusieurs tests de référence, démontrant ainsi une forte compétitivité. De plus, le modèle T2V-1.3B ne nécessite que 8,19 Go de VRAM, ce qui permet son exécution sur presque tous les GPU grand public. Avec une carte graphique RTX 4090, les utilisateurs peuvent générer une vidéo de 5 secondes en 480p en environ 4 minutes, des performances comparables à certains modèles propriétaires.

Wan2.1GP prend en charge plusieurs tâches, telles que la conversion texte-vidéo, image-vidéo et l'édition vidéo, et est le premier modèle capable de générer simultanément des vidéos avec du texte en chinois et en anglais. Cette fonctionnalité offre aux utilisateurs davantage de possibilités d'application. De plus, ce modèle est équipé d'un puissant auto-encodeur variationnel vidéo (VAE), capable de coder et de décoder efficacement des vidéos 1080p de toute longueur, en préservant parfaitement les informations temporelles, jetant ainsi les bases solides de la génération vidéo et d'images.

Pour améliorer l'expérience utilisateur, Wan2.1GP a subi plusieurs optimisations, notamment une réduction significative des besoins en mémoire et en VRAM, et la prise en charge de plusieurs configurations pour s'adapter aux appareils de performances différentes. Les utilisateurs peuvent rapidement prendre en main cet outil grâce à un processus d'installation simplifié. Avec les mises à jour régulières, Wan2.1GP intègre progressivement des fonctionnalités plus pratiques, telles que la prise en charge du cache Tea et l'amélioration de l'interface Gradio, améliorant ainsi la vitesse de génération et la facilité d'utilisation.

Accès au projet : https://github.com/deepbeepmeep/Wan2GP

Points clés :

👍 Performances de pointe : Wan2.1GP excelle dans plusieurs tests de référence, surpassant les solutions open source et commerciales existantes.

🖥️ Haute compatibilité : Nécessite seulement 8,19 Go de VRAM, compatible avec presque tous les GPU grand public, idéal pour les utilisateurs disposant de configurations modestes.

📜 Prise en charge multitâches : Prend en charge plusieurs tâches de génération, telles que la conversion texte-vidéo et image-vidéo, et possède la capacité de générer du texte en chinois et en anglais.