सेलेबवी-टेक्स्ट एक बड़ा पैमाने वाला, उच्च-गुणवत्ता वाला, और विविध चेहरा-पाठ-वीडियो डेटासेट है, जिसका उद्देश्य चेहरा-पाठ-वीडियो निर्माण कार्यों के अनुसंधान को बढ़ावा देना है। इस डेटासेट में 70,000 बाहरी चेहरा वीडियो क्लिप शामिल हैं, जिनमें से प्रत्येक क्लिप में 20 पाठ हैं, जो 40 सामान्य दिखावों, 5 विस्तृत दिखावों, 6 प्रकाश स्थितियों, 37 क्रियाओं, 8 भावनाओं और 6 प्रकाश दिशाओं को कवर करते हैं। सेलेबवी-टेक्स्ट ने वीडियो, पाठ और पाठ-वीडियो सहसंबंध के संदर्भ में अपनी श्रेष्ठता की पुष्टि करने के लिए एक व्यापक सांख्यिकीय विश्लेषण किया है, और चेहरा-पाठ-वीडियो निर्माण कार्यों के मूल्यांकन को मानकीकृत करने के लिए एक मानक भी बनाया है।