Open-Sora-Plan é um modelo de geração de vídeo a partir de texto desenvolvido pela equipe Yuanzu da Universidade de Pequim. Lançado pela primeira vez em abril de 2024 com a versão v1.0.0, ele recebeu amplo reconhecimento na área de geração de vídeo a partir de texto devido ao seu design simples e eficiente e desempenho notável. A versão v1.1.0 apresenta melhorias significativas na qualidade e duração da geração de vídeo, incluindo representação visual comprimida otimizada, qualidade de geração aprimorada e capacidade de geração de vídeos mais longos. O modelo emprega uma arquitetura CausalVideoVAE otimizada, proporcionando maior desempenho e eficiência de inferência. Além disso, mantém o design minimalista e a eficiência de dados da versão v1.0.0, apresentando desempenho semelhante ao modelo base Sora, indicando que sua evolução de versão está alinhada com os princípios de expansão demonstrados pelo Sora.