Loopyモデル
Loopyは、音声のみで駆動する肖像画アバターで、リアルな動きを実現します。
一般製品ビデオ音声駆動肖像画生成
Loopyは、エンドツーエンドの音声駆動型ビデオ拡散モデルです。クロス・クリップとインクリップの時間モジュール、および音声から潜在表現へのモジュールを特別に設計することで、データ内の長期的な運動情報を利用して自然な運動パターンを学習し、音声と肖像画の動きの関連性を高めます。この手法により、既存の方法で必要とされていた空間運動テンプレートの手動指定が不要になり、様々なシーンにおいてよりリアルで高品質な結果を実現します。
Loopyモデル 最新のトラフィック状況
月間総訪問数
8325
直帰率
61.20%
平均ページ/訪問
1.2
平均訪問時間
00:00:11