हालांकि ChatGPT, Claude और Gemini जैसे बड़े भाषा मॉडल प्रभावशाली हैं, लेकिन इन सभी में एक सामान्य बड़ी समस्या है: वे अक्सर भ्रांतियाँ उत्पन्न करते हैं। यह आर्टिफिशियल इंटेलिजेंस के क्षेत्र में एक गंभीर समस्या है, और यहाँ तक कि एप्पल भी भविष्य में एप्पल इंटेलिजेंस द्वारा भ्रांतियों के प्रबंधन को लेकर चिंतित है। सौभाग्य से, शोधकर्ताओं के एक समूह ने अब एक AI भ्रांति डिटेक्टर विकसित किया है, जो यह判断 कर सकता है कि AI ने सामग्री का निर्माण किया है या नहीं।
छवि स्रोत टिप्पणी: चित्र AI द्वारा उत्पन्न, चित्र अनुज्ञा सेवा प्रदाता Midjourney
ये भ्रांतियाँ कई शर्मनाक और दिलचस्प गलतियों का कारण बनी हैं, और ये भी ChatGPT जैसे AI के और अधिक व्यावहारिक बनने के मुख्य कारणों में से एक हैं। हमने देखा है कि गूगल को अपने AI सर्च ओवरव्यू को संशोधित करना पड़ा क्योंकि AI ने लोगों को पत्थर खाने के लिए सुरक्षित बताना शुरू कर दिया, और यहां तक कि कहा कि पिज्जा पर गोंद लगाना सुरक्षित है। यहां तक कि एक वकील ने ChatGPT का उपयोग अदालत के दस्तावेज़ तैयार करने में किया, और परिणामस्वरूप, चैटबॉट द्वारा दस्तावेज़ में उद्धरणों का निर्माण करने के कारण उसे दंडित किया गया।
इस पेपर के अनुसार, शोधकर्ताओं द्वारा विकसित नया एल्गोरिदम AI द्वारा उत्पन्न उत्तरों की सटीकता को लगभग 79% समय में पहचानने में मदद कर सकता है। निश्चित रूप से, यह एक पूर्ण रिकॉर्ड नहीं है, लेकिन वर्तमान में अन्य प्रमुख विधियों की तुलना में 10% बेहतर है।
Gemini और ChatGPT जैसे चैटबॉट उपयोगी हो सकते हैं, लेकिन वे काल्पनिक उत्तर उत्पन्न करने में भी बहुत आसान होते हैं। यह अध्ययन ऑक्सफोर्ड विश्वविद्यालय के कंप्यूटर विज्ञान विभाग के सदस्यों द्वारा किया गया है। शोधकर्ताओं ने पेपर में स्पष्ट किया है कि उनका उपयोग किया गया तरीका अपेक्षाकृत सरल है।
सबसे पहले, उन्होंने चैटबॉट को एक ही संकेत पर कई बार उत्तर देने के लिए कहा, आमतौर पर पांच से दस बार। फिर, उन्होंने एक मान निकाला जिसे हम सेमांटिक एंट्रॉपी कहते हैं, जो उत्तरों के अर्थ की समानता या भिन्नता का माप है। यदि मॉडल प्रत्येक संकेत प्रविष्टि के उत्तर में भिन्नता दिखाता है, तो सेमांटिक एंट्रॉपी स्कोर अधिक होगा, जो दर्शाता है कि AI संभवतः उत्तरों का निर्माण कर रहा है। हालाँकि, यदि उत्तर समान या अर्थ में समान हैं, तो सेमांटिक एंट्रॉपी स्कोर कम होगा, जो दर्शाता है कि यह दिए गए उत्तर अधिक सुसंगत हैं और संभवतः सत्य हैं। यह एक प्रतिशत सटीक AI भ्रांति डिटेक्टर नहीं है, लेकिन यह एक दिलचस्प समाधान है।
अन्य विधियाँ तथाकथित नाइव एंट्रॉपी पर निर्भर करती हैं, जो आमतौर पर उत्तरों के शब्दों के भिन्नता की जांच करती हैं, उनके अर्थ की नहीं। इसलिए, यह सेमांटिक एंट्रॉपी की गणना करने की तुलना में भ्रांतियों का सटीकता से पता लगाने में कम सक्षम है, क्योंकि यह वाक्यों में शब्दों के पीछे के अर्थ पर ध्यान नहीं देती।
शोधकर्ताओं ने कहा कि यह एल्गोरिदम ChatGPT जैसे चैटबॉट में बटन के माध्यम से जोड़ा जा सकता है, जिससे उपयोगकर्ताओं को उनके संकेतों के लिए प्राप्त उत्तरों के लिए "निश्चितता स्कोर" प्राप्त होता है। चैटबॉट में सीधे AI भ्रांति डिटेक्टर को शामिल करना आकर्षक है, इसलिए विभिन्न चैटबॉट में ऐसे उपकरणों को जोड़ने का उपयोग समझ में आता है।