最高効果！階躍星辰オープンソースStep-Video-T2V動画生成モデル

AIbase基地

公開日AIニュース · 1 分で読めます · Feb 18, 2025

348

本日、階躍星辰と吉利汽車集団は、共同でStepシリーズの2つの多様な大規模言語モデル、Step-Video-T2V動画生成モデルとStep-Audio音声モデルをオープンソースとして公開することを発表しました。

その中でも、階躍Step-Video-T2V動画生成モデルは、パラメーター数と性能において世界をリードするレベルにあります。このモデルは300億のパラメーターを持ち、204フレーム、540Pの高解像度動画を直接生成でき、生成されたコンテンツの情報密度が高く、一貫性も高いことを保証します。評価結果によると、Step-Video-T2Vは、指示の遵守、モーションの滑らかさ、物理的な妥当性、美しさなどにおいて優れた性能を示し、既存の最良のオープンソース動画モデルを大幅に上回っています。

微信截图_20250218085337.png

現在、これらのモデルはどちらも躍問アプリで公開されており、開発者の皆様は自由に体験して貴重なご意見をお寄せいただけます。

階躍Step-Video-T2V動画生成モデルは、複雑な動き、美しい人物描写、想像力豊かなビジュアル表現において卓越した生成能力を発揮します。指示を正確に理解し、動画制作者の創造的な表現を効率的に支援します。優雅なバレエ、激しい空手、緊迫感あふれるバドミントン、高速回転の飛び込みなど、Step-Video-T2Vは物理法則に則ったリアルな映像を生成できます。

また、様々なカメラワークやショットの切り替えにも対応し、ダイナミックな映像表現を生成できます。生成される人物像はよりリアルで生き生きとしており、細部まで精巧に表現され、自然な表情をしています。

GitHub:

https://github.com/stepfun-ai/Step-Audio

Hugging Face:

https://huggingface.co/collections/stepfun-ai/step-audio-67b33accf45735bb21131b0b

技術レポート:

https://github.com/stepfun-ai/Step-Audio/blob/main/assets/Step-Audio.pdf

ファーウェイ昇騰と階躍星辰、オープンソースのマルチモーダルモデルを発表 AI新分野に進出

先日、魔楽コミュニティ（Modelers）で、階躍星辰が開発したオープンソースのマルチモーダル大規模モデルであるStep-VideoとStep-Audioが正式に公開されました。これらのモデルは、それぞれ動画生成と音声対話に使用され、開発者と企業ユーザーにより強力なAIツールを提供することを目指しています。Step-Videoモデルの正式名称はStep-Video-T2Vで、300億パラメーターという世界最大のオープンソース動画生成モデルです。このモデルは、20秒の動画を直接生成できます。

アリババクラウド魔搭、階躍星辰の最新オープンソースの2つのマルチモーダルモデルを初公開

世界の開発者の視線が再び中国に注がれています！注目を集めるグローバル・デベロッパー・カンファレンス（GDC）において、アリババクラウド魔搭コミュニティは、階躍星辰の最新オープンソースの2つのマルチモーダルモデルを初公開すると発表しました。これには、世界最大規模のパラメータを持つオープンソースのビデオ生成モデルStep-Video-T2Vと、業界初の製品レベルのオープンソース音声対話モデルStep-Audioが含まれます。このニュースは瞬く間に世界のAIオープンソースコミュニティを席巻し、中国の人工知能分野における強力なイノベーション能力を改めて示しました。中国最大のAI...

当虹科技のBlackEye大規模モデルとDeepSeekの深層融合

先日、当虹科技は、同社のBlackEyeマルチモーダル視覚・聴覚大規模モデルが、DeepSeek-R1とDeepSeek Janus Proとの深層融合に成功したと発表しました。この画期的な進歩は、当虹科技が、視覚情報伝達・メディア、産業・衛星、車載インテリジェントコックピットなど、複数の業界における応用可能性をさらに拡大することを意味します。技術の急速な発展に伴い、マルチモーダル大規模モデルは、各業界のイノベーションを推進する重要な力になりつつあります。DeepSeekの技術とBla...

階躍星辰躍問アプリが「AIクリエイティブボード」をリリース：コードなしでアプリ開発が可能に

上海階躍星辰智能科技有限公司が運営する躍問アプリは、新たに「躍問AIクリエイティブボード」機能をリリースしました。これにより、コードの知識がなくてもアプリ開発が可能になります。デジタル時代において、多くの革新的なアイデアはプログラミングスキル不足により実現に至らないことがありました。躍問アプリの「AIクリエイティブボード」機能は、この課題を解決し、アプリ開発の敷居を下げることを目指しています。最新バージョンにアップデートして、左下の「クリエイティブボード」をクリックし、簡単な文章（プロンプト）で指示を出すだけで利用できます。