CelebV-Text
Ensemble de données vidéo-texte sur les visages à grande échelle
Produit OrdinaireVidéoVisageTexte
CelebV-Text est un ensemble de données vidéo-texte sur les visages, à grande échelle, de haute qualité et diversifié, conçu pour faire progresser la recherche sur les tâches de génération vidéo-texte sur les visages. Il contient 70 000 clips vidéo de visages issus de contextes réels. Chaque clip est associé à 20 descriptions textuelles, couvrant 40 aspects généraux d'apparence, 5 aspects détaillés d'apparence, 6 conditions d'éclairage, 37 actions, 8 émotions et 6 directions de lumière. CelebV-Text a démontré sa supériorité en matière de vidéo, de texte et de corrélation vidéo-texte grâce à une analyse statistique exhaustive, et établit une référence pour normaliser l'évaluation des tâches de génération vidéo-texte sur les visages.
CelebV-Text Dernière situation du trafic
Nombre total de visites mensuelles
386
Taux de rebond
46.59%
Nombre moyen de pages par visite
1.0
Durée moyenne de la visite
00:00:00