क्या आपको याद है उन AI द्वारा बनाए गए चित्र जिन्होंने आपको शर्मिंदगी में डाल दिया था? कभी-कभी आप बस एक प्यारी बिल्ली की तस्वीर चाहते हैं, लेकिन AI आपको एक ऐसी "कला कृति" देता है जो आपको लाल कर देती है। चिंता न करें, यह शर्मनाक दिन जल्द ही इतिहास बन जाएंगे!

फुदान विश्वविद्यालय की अनुसंधान टीम ने हाल ही में एक तकनीक विकसित की है जो "AI को सुधारने" में सक्षम है, जिससे उन शरारती AI मॉडल तुरंत अनुशासित और आज्ञाकारी बन जाते हैं। इस तकनीक का नाम "संविधान मिटाने की विधि" (RECE) है, जो AI में एक सुपर मजबूत फ़िल्टर लगाने की तरह है, जो एक झपकी में उन अनुपयुक्त विचारों को "मिटा" सकता है।

image.png

सिर्फ 3 सेकंड में, AI एक पूर्ण "विचार परिवर्तन" कर सकता है। यह प्रक्रिया न केवल तेज़ है, बल्कि काफी सटीक भी है। सबसे अच्छी बात यह है कि इस "सफाई" का AI की अन्य क्षमताओं पर कोई असर नहीं पड़ेगा, जैसे कि इसे केवल एक दिमागी सफाई दी गई है, जबकि इसकी सभी प्रतिभाएँ बनी रहती हैं।

अनुसंधान टीम ने "बंद समाधान" नामक एक जादुई फॉर्मूला का उपयोग किया, जो AI मॉडल के विशिष्ट भागों को सटीक रूप से लक्षित और संशोधित करता है। यह AI के लिए एक सूक्ष्म "मस्तिष्क सर्जरी" करने के समान है, न कि इसे पूरी तरह से बदलने के लिए क्रूरता से किया गया। यह विधि न केवल प्रभावी है, बल्कि "सर्जरी लागत" को भी बचाती है।

प्रयोग के परिणाम उत्साहजनक हैं! RECE तकनीक से संसाधित AI मॉडल द्वारा अश्लील चित्र बनाने की संभावना में भारी कमी आई है, जबकि अन्य सामान्य रचनात्मक क्षमताएँ बरकरार रखी गई हैं। यह AI को एक नैतिक कंपास लगाने की तरह है, जिससे यह रचनात्मकता के समुद्र में यात्रा करते समय सही रास्ते पर चल सके।

बेशक, कुछ विशेषज्ञों ने चिंता जताई है: क्या AI को सुधारते समय, हम अनजाने में इसकी रचनात्मकता को भी नहीं मिटा देंगे? यह वास्तव में एक गंभीर प्रश्न है। आखिरकार, हम चाहते हैं कि AI अधिक उपयुक्त हो, लेकिन हम नहीं चाहते कि यह बहुत कठोर हो जाए।

कुल मिलाकर, RECE तकनीक का उदय निश्चित रूप से AI के भविष्य के विकास के लिए एक नया मार्ग खोलता है। हमें विश्वास है कि भविष्य के AI सहायक न केवल अधिक बुद्धिमान होंगे, बल्कि वे भावनाओं को भी समझने में सक्षम होंगे और हमें "सरप्राइज" देने से बचेंगे।

शोध पत्र का लिंक: https://arxiv.org/pdf/2407.12383

कोड: https://github.com/CharlesGong12/RECE