Lumiere

時空間拡散モデルによるビデオ生成

一般製品ビデオビデオ合成テキストからビデオ

Lumiereは、リアルで多様性があり、連続した動きを示すビデオを合成することを目的とした、テキストからビデオへの拡散モデルです。ビデオ合成における主要な課題の解決を目指しています。本モデルでは、ビデオ全体の時間的持続を一度に生成できる時空間U-Netアーキテクチャを導入しました。これは、遠距離のキーフレームを合成し、その後時間的超解像度処理を行う既存のビデオモデルとは対照的であり、この手法ではグローバルな時間的一貫性を達成することが本質的に困難です。空間と（重要なことですが）時間のダウンサンプリングとアップサンプリングを導入し、事前学習済みのテキストから画像への拡散モデルを活用することで、当モデルは全フレームレートの低解像度ビデオを複数の時空間スケールで直接生成することを学習します。最先端のテキストからビデオへの生成結果を示し、当モデルの設計が、画像からビデオ、ビデオ修復、スタイル変換生成など、様々なコンテンツ制作タスクやビデオ編集アプリケーションを容易に促進することを示します。

リアルで多様性があり、連続した動きを示すビデオの合成
ビデオ全体の時間的持続を一度に生成
様々なコンテンツ制作タスクやビデオ編集アプリケーションを容易に促進

ビデオ合成、画像からビデオ、ビデオ修復、スタイル変換生成などのコンテンツ制作やビデオ編集アプリケーションに適用可能です。

ビデオ合成アプリケーションの利用例
画像からビデオへのアプリケーションの利用例
ビデオ修復アプリケーションの利用例

ウェブサイトを開く

Lumiere 最新のトラフィック状況

月間総訪問数

29742941

直帰率

44.20%

平均ページ/訪問

5.9

平均訪問時間

00:04:44

Lumiere 訪問数の傾向

Lumiere 訪問地理的分布

Best AI Websites & Tools

Lumiere

Lumiere 最新のトラフィック状況

Lumiere 訪問数の傾向

Lumiere 訪問地理的分布

Lumiere トラフィックソース

Lumiere 代替品

Lumiere — 時空間拡散モデルによるビデオ生成

Magic 1-For-1 — Magic 1-For-1は、1分間のビデオを1分で生成できる、効率的な画像からビデオへの生成モデルです。

STAR — STARは、実世界のビデオ超解像度のための時空間エンハンスメントフレームワークであり、強力なテキストからビデオへの拡散事前学習モデルを初めて実世界のビデオ超解像度に取り込みました。

VideoVAEPlus — 高忠実度ビデオエンコーディング。大規模な動きのシーンにも対応するビデオ自己符号化器です。

Pyramid Flow miniFLUX — 高効率な自己回帰型ビデオ生成モデル

Allegro — 高度なテキストからビデオへの生成モデル

ViewCrafter — 高精細な新視点合成を行うビデオ拡散モデル

CogVideoX — テキストからビデオを生成するモデル

Open-Sora Plan v1.2 — テキストからビデオを生成する分野における最先端のモデルアーキテクチャ

VideoTetris — テキストからビデオを生成する革新的なフレームワーク

SF-V — 高品質なビデオ合成を実現するシングルステップビデオ生成モデルです。

Mira — 高画質の長尺ビデオ生成を目指す実験的なフレームワーク。シーケンス長の拡張とダイナミクス強化を実現しています。

ステップの調整 (Align Your Steps) — 拡散モデルの標本化スケジュールを最適化し、生成モデルの出力品質を向上させる方法です。

CameraCtrl — テキスト生成ビデオのカメラ姿勢を精密に制御します

VLOGGER — テキストと音声によって駆動される人体ビデオ生成。人物の入力画像一枚からビデオを生成します。

OpenDiT — OpenDiT：シンプルで高速、効率的なDiTトレーニングと推論システム

Snap Video — Snap Video：テキストからビデオを合成するための拡張可能な時空間変換器

Sora AIビデオ — Sora AI開発による、テキストからビデオを生成するモデル

Opus — デジタル時代のスマートラグジュアリー

MagicVideo-V2 — 多段階の高画質ビデオ生成

InstructVideo — テキストからビデオを生成する、指示生成モデル

VividTalk — リアルでリップシンクのラップビデオを生成

ShortVideoGen — テキストから音声付きのショートビデオを生成します