Recientemente, Alibaba lanzó en plena noche su nuevo modelo de generación de video de código abierto, Wan2.1. Con sus 14 mil millones de parámetros, este modelo rápidamente se ha situado en la cima de la lista VBench, convirtiéndose en uno de los líderes en el campo de la generación de video.

A diferencia de QwQ-Max, lanzado anteriormente, Wan2.1 destaca por su excelente manejo de detalles en movimientos complejos, capaz de generar con fluidez bailes sincronizados de múltiples personajes, lo cual es realmente impresionante.

Cerebro Modelo de lenguaje grande

Nota de la fuente: Imagen generada por IA, proveída por Midjourney.

Además de las versiones de 14 mil millones y 1.3 mil millones de parámetros, Alibaba también ha lanzado dos modelos adicionales de generación de video, ambos bajo la licencia Apache2.0, lo que significa que los usuarios pueden utilizarlos comercialmente de forma gratuita. Los usuarios pueden acceder al modelo a través de la plataforma de Alibaba para generar videos rápidamente, aunque la alta demanda puede ocasionar tiempos de espera prolongados. Para usuarios con conocimientos técnicos, también está disponible la instalación y configuración a través de plataformas como HuggingFace y la comunidad MoDa.

El mayor atractivo de Wan2.1 reside en sus innovaciones tecnológicas. El modelo emplea una arquitectura Diffusion Transformer y un codificador automático variacional 3D, diseñados específicamente para la generación de video. Gracias a la incorporación de diversas estrategias de compresión y procesamiento en paralelo, el modelo logra una considerable mejora en la eficiencia de generación sin sacrificar la calidad. Los estudios demuestran que la velocidad de reconstrucción de Wan es 2.5 veces superior a la de tecnologías similares, lo que supone un gran ahorro de recursos computacionales.

En cuanto a la experiencia del usuario, Wan2.1 ha recibido excelentes críticas. Tanto en la generación de detalles en escenas dinámicas como en la representación de efectos físicos realistas, el rendimiento del modelo es excepcional. Los usuarios pueden crear videos de alta calidad y lograr una presentación dinámica de texto con facilidad, abriendo nuevas posibilidades creativas.

El modelo Wan2.1 de Alibaba no solo representa un avance tecnológico, sino que también ofrece a los creadores una mayor libertad creativa, marcando un nuevo hito en la tecnología de generación de video.