Open-Sora-Planは、北京大学元組チームによって開発されたテキストから動画を生成するモデルです。2024年4月にv1.0.0版が初公開され、シンプルで効率的な設計と優れた性能により、テキストから動画を生成する分野で広く認められています。v1.1.0版では、動画生成の品質と時間の長さにおいて大幅な改善が施され、圧縮された視覚表現の最適化、生成品質の向上、より長い動画の生成能力を実現しています。このモデルは最適化されたCausalVideoVAEアーキテクチャを採用し、より高い性能と推論効率を実現しています。さらに、v1.0.0版の極めてシンプルな設計とデータ効率性を維持しており、Sora基礎モデルと同等の性能を示しており、そのバージョンアップはSoraが示す拡張則と一致していることを示唆しています。