VideoDrafter

内容の一貫性を保ったマルチシーン動画生成

一般製品ビデオ動画生成内容の一貫性
VideoDrafterは、内容の一貫性を保ったマルチシーン動画生成フレームワークです。大規模言語モデル(LLM)を利用して、入力プロンプトを、複数のシーンの脚本を含む包括的な脚本に変換します。この脚本には、イベント、前景/背景のエンティティ、カメラの動きに関するプロンプトが含まれます。VideoDrafterは脚本内の共通エンティティを識別し、LLMに各エンティティの詳細な説明を求めます。次に、各エンティティの説明をテキストツーイメージモデルに入力して、各エンティティの参照画像を生成します。最後に、参照画像、イベントの説明、カメラの動きを考慮して、拡散プロセスを通じてマルチシーン動画を生成します。拡散モデルは、参照画像を条件とアライメントとして処理し、マルチシーン動画の内容の一貫性を高めます。
ウェブサイトを開く

VideoDrafter 最新のトラフィック状況

月間総訪問数

29742941

直帰率

44.20%

平均ページ/訪問

5.9

平均訪問時間

00:04:44

VideoDrafter 訪問数の傾向

VideoDrafter 訪問地理的分布

VideoDrafter トラフィックソース

VideoDrafter 代替品