CelebV-Text

大規模顔テキスト-ビデオデータセット

一般製品ビデオテキスト
CelebV-Textは、大規模で高品質かつ多様な顔テキスト-ビデオデータセットであり、顔テキスト-ビデオ生成タスクの研究促進を目的としています。本データセットは、70,000本の野外で撮影された顔ビデオクリップを含んでおり、各クリップには20個のテキストが付属しています。これらは、40種類の一般的外観、5種類の詳細な外観、6種類の照明条件、37種類の動作、8種類感情、6種類の光線方向を網羅しています。CelebV-Textは、ビデオ、テキスト、およびテキスト-ビデオ間の関連性においてその優位性を包括的な統計分析によって検証しており、顔テキスト-ビデオ生成タスクの評価を標準化するベンチマークも構築しています。
ウェブサイトを開く

CelebV-Text 最新のトラフィック状況

月間総訪問数

386

直帰率

46.59%

平均ページ/訪問

1.0

平均訪問時間

00:00:00

CelebV-Text 訪問数の傾向

CelebV-Text 訪問地理的分布

CelebV-Text トラフィックソース

CelebV-Text 代替品