O Open-Sora Plan v1.2 é um modelo de geração de vídeo de código aberto, focado na tarefa de conversão de texto para vídeo. Ele adota uma arquitetura de atenção 3D completa, otimizando a representação visual do vídeo e melhorando a eficiência de inferência. Este modelo apresenta inovação na área de geração de vídeo, sendo capaz de capturar melhor as características espaciais e temporais conjuntas, oferecendo um novo caminho tecnológico para a geração automática de conteúdo de vídeo.