Stability AI、単一動画から多視点動画を生成するモデル「Stable Video 4D」を発表

AIbase基地

公開日AIニュース · 1 分で読めます · Jul 25, 2024

215

最近、Stability AI社は画期的な動画処理技術「Stable Video4D」を発表しました。この技術は、単一視点の動画を8つの異なる視点の動画に変換でき、クリエイターに前例のない柔軟性と創造性を提供します。

Stable Video4Dは、同社が以前発表したStable Video Diffusionモデルを基盤としています。画像を動画に変換するのではなく、この新しいモデルは動画を入力として受け取り、複数の新しい視点の動画を出力します。これにより、画像ベースの動画生成から完全な3Dダイナミック動画合成への大きな飛躍を実現しました。

使用方法としては、ユーザーは動画をアップロードし、必要な3Dカメラの位置を指定するだけで、Stable Video4Dが8つの新しい視点の動画を生成します。これにより、あらゆる角度からの多角的な視点を得ることができます。現在、このモデルは約40秒で8つの視点の5フレームの動画を生成でき、4D最適化全体には約20～25分かかります。

以前の方法と比較して、Stable Video4Dは複数の新しい視点の動画を同時に生成できるため、空間と時間軸の一貫性が大幅に向上します。これにより、複数の視点とタイムスタンプにおけるオブジェクトの一貫性が確保されるだけでなく、より軽量な4D最適化フレームワークが実現します。

Stability AIは、Stable Video4Dは現在研究段階にあり、将来はゲーム開発、動画編集、仮想現実などの分野で広く利用される可能性があると述べています。同社は、より幅広い現実世界の動画を処理できるように、モデルの最適化に積極的に取り組んでいます。

Stable Video4Dは現在、Hugging Faceプラットフォームで公開されています。Stability AIは、継続的な研究開発を通じて、この技術によるリアルな多角的動画作成の可能性をさらに高めることを期待しています。同社は、研究者、専門家、コミュニティと協力して技術革新を推進し、モデルの性能を継続的に向上させていきます。

モデルアドレス：https://huggingface.co/stabilityai/sv4d

ファーウェイ昇騰と階躍星辰、オープンソースのマルチモーダルモデルを発表 AI新分野に進出

先日、魔楽コミュニティ（Modelers）で、階躍星辰が開発したオープンソースのマルチモーダル大規模モデルであるStep-VideoとStep-Audioが正式に公開されました。これらのモデルは、それぞれ動画生成と音声対話に使用され、開発者と企業ユーザーにより強力なAIツールを提供することを目指しています。Step-Videoモデルの正式名称はStep-Video-T2Vで、300億パラメーターという世界最大のオープンソース動画生成モデルです。このモデルは、20秒の動画を直接生成できます。

動画トレーニングLoRA登場！Ostrisが20枚の写真で驚きのWan 2.1 LoRAを作成

2025年3月9日、カリフォルニア州——オープンソースモデルによって、テキストから動画を生成する技術がますます魅力的になっています。AI開発者Ostris（@ostrisai）は最近、Xプラットフォームで、自身の20枚ほどの画像を用いてトレーニングしたWan 2.1 LoRAモデルの成果を共有しました。家庭用のRTX4090グラフィックカードを使用するだけで、驚くほど高品質な動画生成を実現しています。この成果はオープンソース技術の可能性を示すだけでなく、Xコミュニティで動画LoRAトレーニングに関する議論を活発化させています。

腾讯开源全新图像转视频模型HunyuanVideo-I2V

A Tencent anunciou o lançamento de código aberto de sua nova estrutura de geração de vídeo a partir de imagem — HunyuanVideo-I2V. O lançamento deste modelo representa mais um avanço importante após o sucesso do lançamento de código aberto do HunyuanVideo, e visa impulsionar a exploração aprofundada da comunidade de código aberto. O HunyuanVideo-I2V incorpora tecnologias avançadas de geração de vídeo, permitindo a transformação de imagens estáticas em conteúdo de vídeo dinâmico, oferecendo mais possibilidades aos criadores. O HunyuanVideo-I2V utiliza um pré-treinamento...

AIニュース

Stability AI、単一動画から多視点動画を生成するモデル「Stable Video 4D」を発表

AIbase基地

関連AIニュースの推奨

ファーウェイ昇騰と階躍星辰、オープンソースのマルチモーダルモデルを発表 AI新分野に進出

動画トレーニングLoRA登場！Ostrisが20枚の写真で驚きのWan 2.1 LoRAを作成

アリババのAIビデオモデル通義万象（Wanxiang）が独立ウェブサイトをローンチ

腾讯开源全新图像转视频模型HunyuanVideo-I2V