Wan2.1 es un modelo de generación de vídeo a gran escala, avanzado y de código abierto, diseñado para impulsar los límites de la tecnología de generación de vídeo. Mediante un innovador autocodificador variacional espacio-temporal (VAE), estrategias de entrenamiento escalables, construcción de datos a gran escala y métricas de evaluación automatizadas, mejora significativamente el rendimiento y la generalización del modelo. Wan2.1 admite diversas tareas, incluyendo texto a vídeo, imagen a vídeo y edición de vídeo, y puede generar contenido de vídeo de alta calidad. El modelo ha demostrado un rendimiento excelente en varias pruebas de referencia, incluso superando a algunos modelos de código cerrado. Su naturaleza de código abierto permite a los investigadores y desarrolladores utilizar y ampliar libremente el modelo para diversas aplicaciones.