2025年1月22日、上海階躍星辰智能科技有限公司は、動画生成モデルStep-Videoが正式にV2バージョンにアップグレードされたことを発表しました。今回のアップグレードは、顕著な技術的ブレークスルーと機能強化をもたらし、現実世界のシミュレーションにおいてより強力なものとなりました。

Step-Video V2バージョンは、複数の主要技術分野において最適化と革新が行われました。まず、より高い圧縮率のVAEモデルを採用することで、空間と時間の効率的な圧縮を実現し、再構成品質を維持しながら計算複雑度を大幅に削減し、生成効率を向上させました。次に、Step-Video V2はDiTアーキテクチャを深く最適化し、強化学習アルゴリズムを導入することで、動画生成の滑らかさと細部表現力をさらに向上させました。さらに、自社開発のマルチモーダル理解大規模モデルと動画知識ベースを組み合わせることで、動画の内容とカメラワークをより正確に描写し、より現実世界に近い動画を生成できます。

微信截图_20250123090916.png

実際の応用において、Step-Video V2は強力な複雑な動き生成能力を示しています。バレエ、空手、バドミントンなどのシーンにおいて、滑らかに動的な映像を表現できます。同時に、このモデルは人物の表情捕捉において優れた性能を発揮し、実在の人物や架空のキャラクターの表情や光の陰影効果を繊細に表現できます。さらに、Step-Video V2は、パン、チルト、ズーム、トラッキングなどの様々な動き方、そして異なるショット間の切り替えなど、豊富なカメラワークをサポートしており、動画制作の可能性を広げています。

特筆すべきは、Step-Video V2が基本的なテキスト生成機能を追加したことで、テキストを自然に動画コンテンツに融合させることができ、前世代のモデルよりも生成効果が大幅に向上しています。この機能の追加により、動画生成の適用範囲がさらに広がりました。

現在、Step-Video V2は躍問ウェブ端(https://yuewen.cn/videos)で試用申請を受け付けており、ユーザーはアップグレード後の強力な機能を体験できます。

今回のアップグレードは、階躍星辰の動画生成分野における技術進歩を示すだけでなく、クリエイターにより強力なツールを提供し、動画制作を新たな段階へと押し進めるものです。