प्राकृतिक भाषा प्रसंस्करण और प्राकृतिक भाषा निर्माण की प्रगति के साथ, बड़े भाषा मॉडल का वास्तविक अनुप्रयोगों में व्यापक रूप से उपयोग किया गया है। शोधकर्ताओं ने नए डेटा सेट और फ्रेमवर्क AboutMe के माध्यम से डेटा फ़िल्टरिंग के पाठ पर प्रभाव को दर्ज किया है। "मेरे बारे में" अनुभाग का विश्लेषण करके, शोध टीम ने वेबसाइट के लेखकों की रुचियों, सामाजिक भूमिकाओं और भौगोलिक स्थानों जैसी जानकारी को मापा। उन्होंने पूर्व-प्रशिक्षित डेटा छानने की प्रक्रिया की जटिलता पर जोर दिया और इसके सामाजिक प्रभावों पर आगे के शोध की मांग की।