हाल ही में, प्रिंसटन विश्वविद्यालय की अनुसंधान टीम ने एक दिलचस्प शोध रिपोर्ट जारी की, जिसमें बताया गया कि अगस्त 2024 में, विकिपीडिया पर लगभग 4.36% नई लेखों में महत्वपूर्ण AI जनित सामग्री शामिल है।

यह अध्ययन क्रेस्टन ब्रूक्स, सैमुअल एग्गर्ट और डेनिस पेस्कॉफ द्वारा संयुक्त रूप से किया गया, जिन्होंने इन AI जनित सामग्री का पता लगाने के लिए GPTZero और Binoculars नामक उपकरणों का उपयोग किया।

विकिपीडिया

शोध से पता चलता है कि GPT-3.5 के रिलीज से पहले के डेटा की तुलना में, 2024 के विकिपीडिया लेखों में AI जनित सामग्री में स्पष्ट वृद्धि हुई है। जांच की गई 2909 अंग्रेजी विकिपीडिया लेखों में, GPTZero ने 156 लेखों को चिह्नित किया, जबकि Binoculars ने 96 लेखों को चिह्नित किया, और इन दोनों उपकरणों के बीच 45 लेखों में ओवरलैप था।

चिह्नित लेख आमतौर पर गुणवत्ता में निम्न होते हैं, और इनमें संदर्भ भी कम होते हैं, और विकिपीडिया के ज्ञान नेटवर्क में अच्छी तरह से समाहित नहीं होते हैं। कुछ लेख तो आत्म-प्रचारित लगते हैं, जो व्यक्तिगत या व्यावसायिक प्रचार से संबंधित होते हैं, और अक्सर केवल सतही संदर्भों के साथ होते हैं, जैसे व्यक्तिगत YouTube वीडियो।

राजनीतिक सामग्री के संदर्भ में, आठ लेख स्पष्ट रूप से विशिष्ट विचारों को बढ़ावा देते हैं, जिनमें कुछ विवादास्पद विषय शामिल हैं, जैसे कि अल्बानिया के इतिहास से संबंधित संपादन युद्ध। इसके अलावा, कुछ उपयोगकर्ताओं ने बड़े भाषा मॉडल (LLMs) का उपयोग करके कुछ असामान्य विषयों पर सामग्री लिखी है, जिसमें कवक, भोजन और खेल शामिल हैं, यहां तक कि अध्याय वार पुस्तक सारांश की सामग्री भी है।

शोध ने विकिपीडिया की AI जनित सामग्री की तुलना Reddit और संयुक्त राष्ट्र के समाचार पत्रों से की, और पाया कि Reddit पर AI जनित सामग्री विकिपीडिया की तुलना में काफी कम है, जो 1% से भी कम है। यह दर्शाता है कि Reddit पर AI जनित सामग्री या तो बहुत कम है, या इसे सेंसर किया गया है, या इसका पता लगाना मुश्किल है। जबकि संयुक्त राष्ट्र के AI जनित समाचार पत्रों में उल्लेखनीय वृद्धि हुई है, जो 2022 में 1% से कम से बढ़कर 2024 में 20% हो गया है।

रिपोर्ट के अंत में यह जोर दिया गया कि जनरेटिव LLMs के उदय के साथ, AI डिटेक्शन उपकरण भी लगातार विकसित हो रहे हैं। लेकिन विभिन्न पाठ की लंबाई, क्षेत्रों और मानव-मशीन एकीकरण जैसे विभिन्न संदर्भों में इन डिटेक्टर्स का मूल्यांकन करना अभी भी चुनौतियों का सामना कर रहा है।

AI जनित सामग्री की चुनौतियों का सामना करने के लिए, व्यक्तियों, शैक्षणिक संस्थानों, व्यवसायों और सरकारों को मानव निर्मित सामग्री को सत्यापित करने के लिए विश्वसनीय तरीकों की सक्रिय रूप से खोज करनी चाहिए। विभिन्न देशों के नियामक संस्थाओं को भी AI जनित सामग्री के प्रबंधन को मजबूत करना चाहिए। उदाहरण के लिए, चीन ने पहले से ही इंटरनेट पर AI जनित जानकारी की पारदर्शिता बढ़ाने के लिए कदम उठाना शुरू कर दिया है और संबंधित मसौदा नियम जारी किए हैं। जबकि भारत ने इस वर्ष AI संबंधित सामग्री के लेबलिंग के लिए सुझाव जारी किया है, हालांकि यह प्रस्ताव व्यापक विवाद और आलोचना का विषय बना है।

मुख्य बिंदु:  

📊 अध्ययन से पता चलता है कि लगभग 4.36% विकिपीडिया के नए लेख AI जनित सामग्री हैं।  

🔍 Reddit पर AI जनित सामग्री 1% से कम है, जो स्पष्ट अंतर दर्शाता है।  

🌐 विभिन्न देश AI जनित सामग्री के लिए नियामक उपायों और लेबलिंग आवश्यकताओं की खोज कर रहे हैं।