CelebV-Text
大規模顔テキスト-ビデオデータセット
一般製品ビデオ顔テキスト
CelebV-Textは、大規模で高品質かつ多様な顔テキスト-ビデオデータセットであり、顔テキスト-ビデオ生成タスクの研究促進を目的としています。本データセットは、70,000本の野外で撮影された顔ビデオクリップを含んでおり、各クリップには20個のテキストが付属しています。これらは、40種類の一般的外観、5種類の詳細な外観、6種類の照明条件、37種類の動作、8種類感情、6種類の光線方向を網羅しています。CelebV-Textは、ビデオ、テキスト、およびテキスト-ビデオ間の関連性においてその優位性を包括的な統計分析によって検証しており、顔テキスト-ビデオ生成タスクの評価を標準化するベンチマークも構築しています。
CelebV-Text 最新のトラフィック状況
月間総訪問数
386
直帰率
46.59%
平均ページ/訪問
1.0
平均訪問時間
00:00:00