AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

VLOGGER

テキストと音声によって駆動される人体ビデオ生成。人物の入力画像一枚からビデオを生成します。

一般製品ビデオビデオ生成人体合成

ウェブサイトを開く

VLOGGERは、一枚の人物入力画像からテキストと音声で駆動される話す人間のビデオを生成する手法です。これは、近年の生成拡散モデルの成功に基づいています。私たちの手法は、1) ランダムな人物から3Dモーションへの拡散モデル、そして2) 時間と空間制御を強化した、新規の拡散ベースアーキテクチャによるテキストから画像へのモデルを含みます。この手法は、可変長の高品質ビデオを生成でき、人間の顔と体の高度な表現方法によって容易に制御できます。以前の研究とは異なり、私たちの手法は個人ごとにトレーニングする必要がなく、顔検出や切り抜きにも依存しません。全身像（顔や唇だけでなく）を生成し、人間らしいコミュニケーションに必要な幅広いシーン（例えば、見える体幹や多様な体格）を考慮しています。

ウェブサイトを開く

VLOGGER 最新のトラフィック状況

月間総訪問数

3160

直帰率

42.89%

平均ページ/訪問

1.7

平均訪問時間

00:00:09

VLOGGER 訪問数の傾向

VLOGGER 訪問地理的分布

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

VLOGGER

VLOGGER 最新のトラフィック状況

VLOGGER 訪問数の傾向

VLOGGER 訪問地理的分布

VLOGGER トラフィックソース

VLOGGER 代替品

VLOGGER — テキストと音声によって駆動される人体ビデオ生成。人物の入力画像一枚からビデオを生成します。

Magic 1-For-1 — Magic 1-For-1は、1分間のビデオを1分で生成できる、効率的な画像からビデオへの生成モデルです。

CogVideoX — テキストからビデオを生成するモデル

Open-Sora Plan v1.2 — テキストからビデオを生成する分野における最先端のモデルアーキテクチャ

VideoTetris — テキストからビデオを生成する革新的なフレームワーク

Mira — 高画質の長尺ビデオ生成を目指す実験的なフレームワーク。シーケンス長の拡張とダイナミクス強化を実現しています。

CameraCtrl — テキスト生成ビデオのカメラ姿勢を精密に制御します

Sora AIビデオ — Sora AI開発による、テキストからビデオを生成するモデル

MagicVideo-V2 — 多段階の高画質ビデオ生成

FramePack — ビデオ生成のための次フレーム予測モデルです。

DreamActor-M1 — DiTベースのヒューマンイメージアニメーションフレームワークであり、精細な制御と長期的な一貫性を実現します。

GAIA-2 — GAIA-2は、安全な自動運転シナリオを作成するための高度なビデオ生成モデルです。

ロングコンテキスト最適化（LCT） — シーンレベルのビデオ生成能力を向上させる技術です。

MM_StoryAgent — MM_StoryAgentは、没入型ストーリービデオを生成するためのマルチエージェントフレームワークです。

Wan.video — Wan_AI Creative Drawingは、人工知能技術を利用してクリエイティブな絵画とビデオ制作を行うプラットフォームです。

hunyuan-video-keyframe-control-lora — これはHunyuanVideoモデルに基づくアダプターであり、キーフレームベースのビデオ生成に使用されます。

CineMaster — CineMasterは、3D空間認識機能を備えた、テキストからビデオを生成する制御可能なフレームワークです。ユーザーは3D空間内でオブジェクトやカメラを操作できます。

Lumina-Video — Lumina-Videoは、テキストからビデオを生成する試作プロジェクトです。

Go with the Flow — ビデオ拡散モデルのモーションモードを効率的に制御するための手法。モーションモードのカスタマイズと転移をサポートします。

Story Flicks — AI大規模言語モデルを使用して、高画質のストーリーショートビデオをワンクリックで生成します。複数の言語モデルと画像生成技術に対応しています。

AIビデオスタートキット — ブラウザ上でAIビデオ生成モデルをデモするためのオープンソースプロジェクトです。

GameFactory — GameFactoryは、事前学習済みのビデオ拡散モデルに基づく汎用的なワールドモデルであり、オープンワールドゲームを作成できます。

Luma Ray2 — リアルな視覚効果と自然で滑らかな動きを生成できる、大規模なビデオ生成モデルです。

シェーダとしての拡散 (Diffusion as Shader) — 様々なビデオ生成制御タスクに対応する統一アーキテクチャモデルです。

STAR — STARは、実世界のビデオ超解像度のための時空間エンハンスメントフレームワークであり、強力なテキストからビデオへの拡散事前学習モデルを初めて実世界のビデオ超解像度に取り込みました。

VideoVAEPlus — 高忠実度ビデオエンコーディング。大規模な動きのシーンにも対応するビデオ自己符号化器です。

DisPose — 人物画像アニメーションを制御するための手法

如意模型 (Ruyi-Models) — 映画レベルの高画質ビデオを生成可能な画像からビデオへの変換モデル

INFP — 音声駆動型のインタラクティブなヘッド生成フレームワーク。二人間の会話用に設計されています。

Veo 2 — Google DeepMind開発の最先端ビデオ生成モデル