Wan2.1 est un modèle de génération vidéo évolué et open source à grande échelle, visant à repousser les limites de la technologie de génération vidéo. Grâce à un auto-encodeur variationnel spatio-temporel (VAE) innovant, une stratégie d'entraînement évolutive, une construction de données à grande échelle et des indicateurs d'évaluation automatisés, il améliore considérablement les performances et l'universalité du modèle. Wan2.1 prend en charge plusieurs tâches, notamment la conversion texte-vidéo, image-vidéo et l'édition vidéo, et permet de générer du contenu vidéo de haute qualité. Ce modèle a obtenu d'excellents résultats dans plusieurs tests de référence, surpassant même certains modèles propriétaires. Son caractère open source permet aux chercheurs et aux développeurs d'utiliser et d'étendre librement ce modèle, adapté à de nombreux scénarios d'application.