CelebV-Text
大规模人脸文本-视频数据集
普通产品视频人脸文本
CelebV-Text是一个大规模、高质量、多样化的人脸文本-视频数据集,旨在促进人脸文本-视频生成任务的研究。数据集包含70,000个野外人脸视频剪辑,每个视频剪辑都配有20个文本,涵盖40种一般外观、5种详细外观、6种光照条件、37种动作、8种情绪和6种光线方向。CelebV-Text通过全面的统计分析验证了其在视频、文本和文本-视频相关性方面的优越性,并构建了一个基准来标准化人脸文本-视频生成任务的评估。
CelebV-Text 最新流量情况
月总访问量
687
跳出率
43.27%
平均页面访问数
1.0
平均访问时长
00:00:00