आज की इस सूचना विस्फोटक युग में, विशेषकर वैज्ञानिक अनुसंधान के क्षेत्र में, नकली पत्रों का उदय लोगों के लिए एक चुनौती बन गया है।
हाल ही में, न्यूयॉर्क राज्य के बिंघमटन विश्वविद्यालय के एक शोधकर्ता अहमद अब्दीन हमेद (Ahmed Abdeen Hamed) ने एक मशीन लर्निंग एल्गोरिदम विकसित किया है जिसका नाम xFakeSci है, जो 94% की सटीकता के साथ नकली शैक्षणिक पत्रों की पहचान कर सकता है।
हमेद ने बताया कि उनका मुख्य शोध क्षेत्र जैव चिकित्सा सूचना विज्ञान है, और महामारी के दौरान, नकली शोध लेखों की बाढ़ आ गई है।
उन्होंने और उनकी टीम ने अल्जाइमर, कैंसर और अवसाद जैसे तीन लोकप्रिय चिकित्सा विषयों पर 50 नकली लेखों का निर्माण किया और इन्हें समान विषय के वास्तविक लेखों के साथ तुलना और विश्लेषण किया। वे इस तरीके से अंतरों और पैटर्नों की पहचान करना चाहते हैं।
शोध प्रक्रिया के दौरान, हमेद ने राष्ट्रीय स्वास्थ्य संस्थान के PubMed डेटाबेस से संबंधित साहित्य निकाला और समान कीवर्ड का उपयोग करके ChatGPT से लेख तैयार कराया। उनकी सहजता ने उन्हें बताया कि नकली और वास्तविक पत्रों के बीच कोई पैटर्न अवश्य होना चाहिए।
विभिन्न डेटा सेटों के नोड्स और एजेस का अनुपात ChatGPT और वैज्ञानिक लेखों के बीच।
गहन विश्लेषण के बाद, xFakeSci एल्गोरिदम मुख्य रूप से दो विशेषताओं पर ध्यान केंद्रित करता है: एक तो लेखों में द्विशब्द संयोजन (bigrams), जैसे "जलवायु परिवर्तन", "क्लिनिकल ट्रायल" आदि, और दूसरा, ये द्विशब्द संयोजन अन्य शब्दों और अवधारणाओं के साथ कैसे जुड़े हुए हैं।
उन्होंने पाया कि नकली पत्रों में द्विशब्द संयोजन की संख्या स्पष्ट रूप से वास्तविक पत्रों की तुलना में कम है, हालांकि ये संयोजन नकली पत्रों में अन्य सामग्री के साथ निकटता से जुड़े होते हैं।
उन्होंने बताया कि एआई द्वारा उत्पन्न लेख अक्सर पाठकों को विश्वास दिलाने के लिए होते हैं, जबकि मानव शोधकर्ताओं का लक्ष्य प्रयोगात्मक परिणामों और विधियों की सच्ची रिपोर्ट करना होता है।
भविष्य में, हमेद योजना बना रहे हैं कि xFakeSci एल्गोरिदम को अधिक क्षेत्रों में विस्तारित किया जाए, जिसमें इंजीनियरिंग, विज्ञान और मानविकी शामिल हैं, ताकि यह सत्यापित किया जा सके कि नकली पत्रों की विशेषताएँ समान हैं या नहीं। उन्होंने जोर दिया कि एआई तकनीक की निरंतर प्रगति के साथ, असली और नकली पत्रों की पहचान करना और भी कठिन होता जाएगा। इसलिए, एक समग्र समाधान डिजाइन करना अत्यंत महत्वपूर्ण है।
हालांकि वर्तमान एल्गोरिदम 94% नकली पत्रों का पता लगा सकता है, फिर भी 6% नकली साहित्य छूट सकता है। उन्होंने विनम्रता से कहा कि, हालांकि महत्वपूर्ण प्रगति हुई है, फिर भी पहचान दर को बढ़ाने और जनता की जागरूकता को बढ़ाने के लिए निरंतर प्रयास की आवश्यकता है।
पत्र का लिंक: https://www.nature.com/articles/s41598-024-66784-6
मुख्य बिंदु:
📄 ** नया उपकरण xFakeSci 94% सटीकता के साथ नकली शोध पत्रों की पहचान करता है, वैज्ञानिक अनुसंधान की सुरक्षा करता है।**
🧪 ** शोधकर्ताओं ने बड़ी संख्या में नकली पत्रों का निर्माण किया और वास्तविक पत्रों के साथ तुलना की, जिससे लेखन शैली में महत्वपूर्ण अंतर पाया गया।**
🔍 ** भविष्य में एल्गोरिदम के अनुप्रयोगों का विस्तार किया जाएगा, ताकि एआई द्वारा उत्पन्न पत्रों की बढ़ती चुनौतियों का सामना किया जा सके।**