階躍星辰ビデオ生成モデルStep-Video V2版リリース基礎テキストの精密生成に対応

AIbase基地

公開日AIニュース · 1 分で読めます · Jan 23, 2025

283

2025年1月22日、上海階躍星辰智能科技有限公司は、動画生成モデルStep-Videoが正式にV2バージョンにアップグレードされたことを発表しました。今回のアップグレードは、顕著な技術的ブレークスルーと機能強化をもたらし、現実世界のシミュレーションにおいてより強力なものとなりました。

Step-Video V2バージョンは、複数の主要技術分野において最適化と革新が行われました。まず、より高い圧縮率のVAEモデルを採用することで、空間と時間の効率的な圧縮を実現し、再構成品質を維持しながら計算複雑度を大幅に削減し、生成効率を向上させました。次に、Step-Video V2はDiTアーキテクチャを深く最適化し、強化学習アルゴリズムを導入することで、動画生成の滑らかさと細部表現力をさらに向上させました。さらに、自社開発のマルチモーダル理解大規模モデルと動画知識ベースを組み合わせることで、動画の内容とカメラワークをより正確に描写し、より現実世界に近い動画を生成できます。

微信截图_20250123090916.png

実際の応用において、Step-Video V2は強力な複雑な動き生成能力を示しています。バレエ、空手、バドミントンなどのシーンにおいて、滑らかに動的な映像を表現できます。同時に、このモデルは人物の表情捕捉において優れた性能を発揮し、実在の人物や架空のキャラクターの表情や光の陰影効果を繊細に表現できます。さらに、Step-Video V2は、パン、チルト、ズーム、トラッキングなどの様々な動き方、そして異なるショット間の切り替えなど、豊富なカメラワークをサポートしており、動画制作の可能性を広げています。

特筆すべきは、Step-Video V2が基本的なテキスト生成機能を追加したことで、テキストを自然に動画コンテンツに融合させることができ、前世代のモデルよりも生成効果が大幅に向上しています。この機能の追加により、動画生成の適用範囲がさらに広がりました。

現在、Step-Video V2は躍問ウェブ端（https://yuewen.cn/videos）で試用申請を受け付けており、ユーザーはアップグレード後の強力な機能を体験できます。

今回のアップグレードは、階躍星辰の動画生成分野における技術進歩を示すだけでなく、クリエイターにより強力なツールを提供し、動画制作を新たな段階へと押し進めるものです。

00後がDeepSeekライブコマースで1日で3.3億元を売り上げる

最近、浙江省杭州市で、AIツールDeepSeekの人気が高まるにつれ、多くの起業家がその強力な機能を活用して収益を上げ始めています。先日、00後のあるストリーマーがDeepSeekを使ってライブコマースを行い、わずか1日で3.3億元相当の商品を販売したというニュースが注目を集めています。報道によると、DeepSeekの助けを借りて、多くの企業や個人が新しい販売方法を試みています。例えば、義烏のある店主はDeepSeekを使って在庫を完売させました。

ServiceNow、AI企業Moveworksを30億ドルで買収へ

アメリカのソフトウェア企業ServiceNowが、AIアシスタントプロバイダーのMoveworksを買収する交渉を進めていると報じられています。この取引はServiceNow史上最大規模の買収となり、取引額は約30億ドルに上る見込みです。情報筋によると、両社の協議は最終段階に入っていますが、遅延や交渉決裂の可能性も残されています。2016年設立のMoveworksは、AI駆動型の従業員アシスタントツール開発に特化しています。

AI搭載ブラウザ？オープンソースツールBrowser Useがテック界を席巻　開発者「YYDS！」と絶賛！

最近、テック界と開発者コミュニティは、Browser Useというオープンソースプロジェクトで沸騰しています！このツールは、まるでAIに羽が生えたかのよう。人間のように自由にブラウザを操作し、自然言語でAIに様々なウェブタスクを自動実行させることができます。その強力な自動化能力と柔軟な展開方法は、瞬く間に世界中のテクノロジー愛好家の心を掴み、X（旧Twitter）では大きな話題を呼んでいます。Browser Useは、まさに燎原の火のごとく、AIによるブラウザ自動化分野を牽引しています。

ファーウェイ昇騰と階躍星辰、オープンソースのマルチモーダルモデルを発表 AI新分野に進出

先日、魔楽コミュニティ（Modelers）で、階躍星辰が開発したオープンソースのマルチモーダル大規模モデルであるStep-VideoとStep-Audioが正式に公開されました。これらのモデルは、それぞれ動画生成と音声対話に使用され、開発者と企業ユーザーにより強力なAIツールを提供することを目指しています。Step-Videoモデルの正式名称はStep-Video-T2Vで、300億パラメーターという世界最大のオープンソース動画生成モデルです。このモデルは、20秒の動画を直接生成できます。

AIニュース

階躍星辰ビデオ生成モデルStep-Video V2版リリース 基礎テキストの精密生成に対応