Alibaba ha lanzado recientemente AtomoVideo, un marco de generación de video a partir de imágenes de alta fidelidad. Emplea una técnica de inyección de imágenes de múltiples granularidades para mejorar la fidelidad del video. Este marco utiliza conjuntos de datos de alta calidad y estrategias de entrenamiento para mantener la temporalidad, la intensidad del movimiento, la coherencia y la estabilidad, ofreciendo además una alta flexibilidad para tareas de predicción de video en secuencias largas.
Además, AtomoVideo se puede integrar con modelos de personalización existentes y módulos controlables para lograr una personalización a medida. Aunque la calidad del video generado actualmente necesita mejoras, esta tecnología tiene un amplio potencial de aplicación.