En 2024, ByteDance lanzó MagicVideo-V2, un modelo de generación de video que, combinado con la tecnología de texto a imagen, mantiene un alto nivel estético. La compañía también presentó Vista-LLaMA, un gran modelo multimodal para abordar los desafíos del contenido de video, y COSA, un modelo base de lenguaje visual preentrenado. ByteDance continúa explorando el campo de la generación de video, contribuyendo al desarrollo de la tecnología de IA.