हाल ही में, कैलिफ़ोर्निया विश्वविद्यालय, सैन डिएगो के संज्ञानात्मक विज्ञान विभाग के नेतृत्व में एक अध्ययन ने कृत्रिम बुद्धिमत्ता के क्षेत्र में एक ऐतिहासिक सफलता हासिल की है: OpenAI का नवीनतम मॉडल GPT-4.5 मानक ट्यूरिंग परीक्षण में, "व्यक्तित्व की भूमिका निभाते हुए" पहली बार मानव प्रदर्शन को पार करने में सफल रहा है, जो वर्तमान में सबसे अधिक मानव जैसी बातचीत क्षमता वाला AI सिस्टम है। इस उपलब्धि ने न केवल AI की भाषा क्षमता के बारे में लोगों की धारणा को नया रूप दिया है, बल्कि सामाजिक बुद्धिमत्ता के क्षेत्र में AI की अनुप्रयोग क्षमता के लिए नए कल्पनाशील स्थान भी खोले हैं।

इस प्रयोग में चार प्रतिनिधि AI सिस्टमों की तुलनात्मक परीक्षण के लिए चयन किया गया था, जिसमें 1960 के दशक का क्लासिक चैटबॉट ELIZA, Meta AI द्वारा विकसित LLaMa-3.1-405B, और OpenAI के GPT-4o और GPT-4.5 शामिल हैं। शोधकर्ताओं ने दो स्वतंत्र परीक्षण समूहों की रचना की, जिनमें से प्रत्येक में ऑनलाइन प्लेटफ़ॉर्म (जैसे Prolific) से 250 प्रतिभागी शामिल थे, कुल मिलाकर 500 प्रतिभागी। ये प्रतिभागी विभिन्न आयु, लिंग और शैक्षिक पृष्ठभूमि के थे, जिससे नमूने की विविधता सुनिश्चित हुई। परीक्षण क्लासिक तीन-पक्षीय ट्यूरिंग परीक्षण के रूप में किया गया था: प्रत्येक रेफरी ने 5 मिनट के भीतर पाठ इंटरफ़ेस के माध्यम से दो वार्तालाप भागीदारों के साथ बातचीत की, जिनमें से एक वास्तविक मानव था और दूसरा परीक्षण किया जा रहा AI सिस्टम था, और फिर रेफरी को यह निर्धारित करना था कि कौन सा मानव है।

image.png

प्रयोग के परिणाम आश्चर्यजनक थे। GPT-4.5 ने दोनों परीक्षण समूहों में 73% की सफलता दर के साथ "मानव के रूप में गलत पहचाना गया", जो मानव की अपनी सफलता दर (जो आमतौर पर 60%-70% के बीच होती है) को पार कर गया, और मानक ट्यूरिंग परीक्षण में वास्तव में "पास" करने वाला पहला AI मॉडल बन गया। इसकी तुलना में, GPT-4o की सफलता दर थोड़ी कम थी, LLaMa-3.1-405B कुछ सेटिंग्स में मानव स्तर के करीब या उससे भी अधिक पहुँच गया, जबकि पुराने सिस्टम ELIZA का प्रदर्शन बहुत पीछे था। शोधकर्ताओं ने विशेष रूप से ध्यान दिया कि GPT-4.5 ने परीक्षण में भाषा की अद्भुत प्राकृतिकता और भावनाओं की प्रचुरता का प्रदर्शन किया, रेफरी के स्वर के अनुसार उत्तरों को लचीले ढंग से समायोजित करने में सक्षम था, जिसे प्रतिभागियों द्वारा अक्सर "मित्रवत" या "वास्तविक" के रूप में वर्णित किया गया था।

image.png

अधिक ध्यान देने योग्य बात यह है कि GPT-4.5 ने न केवल भाषा की तरलता में उत्कृष्ट प्रदर्शन किया, बल्कि एक "मानव जैसी सामाजिक बुद्धिमत्ता" भी प्रदर्शित की। शोध दल का मानना ​​है कि यह मॉडल संक्षिप्त संचार में वार्तालाप में भावनात्मक संकेतों को जल्दी से पकड़ सकता है और मानव सामाजिक अपेक्षाओं के अनुरूप प्रतिक्रिया दे सकता है, यहाँ तक कि कुछ स्थितियों में मानव प्रदर्शन को भी पार कर सकता है। उदाहरण के लिए, जब रेफरी संदेह या भावनात्मक उतार-चढ़ाव दिखाता है, तो GPT-4.5 समय पर सांत्वना या विनोदपूर्ण प्रतिक्रिया दे सकता है, इस तरह की सूक्ष्म बातचीत क्षमता ने कई प्रतिभागियों को यह भ्रम दिया कि वे किसी जीवित व्यक्ति के साथ बातचीत कर रहे हैं।

image.png

इसके विपरीत, LLaMa-3.1-405B यद्यपि तकनीकी रूप से भी प्रभावशाली है, लेकिन भावनात्मक अभिव्यक्ति और संदर्भ अनुकूलन में थोड़ा कमज़ोर है। हालाँकि, विशिष्ट सेटिंग्स में इसका प्रदर्शन मानव स्तर के करीब पहुँच गया है, जो AI प्रतियोगिता में ओपन-सोर्स मॉडल की क्षमता को दर्शाता है। और GPT-4o, जो GPT-4.5 का पूर्ववर्ती है, हालांकि इसकी क्षमता अच्छी है, लेकिन व्यक्तित्व प्रदर्शन और गतिशील समायोजन के मामले में बाद वाले से स्पष्ट अंतर है।

image.png

उद्योग के विशेषज्ञों का कहना है कि GPT-4.5 की सफलता प्रशिक्षण प्रक्रिया में अधिक जटिल व्यक्तित्व की भूमिका निभाने और वार्तालाप रणनीतियों को शामिल करने के कारण हुई है। पारंपरिक भाषा मॉडल के "तात्कालिक निर्माण" के विपरीत, GPT-4.5 वार्तालाप से पहले एक प्रकार का "पूर्वानुमान ढाँचा" बनाने में सक्षम प्रतीत होता है, और वास्तविक समय प्रतिक्रिया के अनुसार उत्तरों को गतिशील रूप से अनुकूलित करता है। इस क्षमता ने इसे संक्षिप्त संचार में असाधारण रूप से "स्मार्ट" बना दिया है, यहाँ तक कि AI के अंतर्निहित यांत्रिक निशान को भी छुपा दिया है। हालाँकि, इसने एक नई चर्चा को भी जन्म दिया है: क्या ट्यूरिंग परीक्षण अभी भी AI बुद्धिमत्ता को मापने का अंतिम मानदंड है? कुछ विद्वानों का मानना ​​है कि GPT-4.5 की सफलता मानव सामाजिक व्यवहार की नकल पर अधिक निर्भर करती है, न कि वास्तविक समझ या स्वतंत्र सोच पर।

किसी भी तरह से, GPT-4.5 की सफलता ने निस्संदेह AI तकनीक के विकास में नई ऊर्जा का संचार किया है। शिक्षा मार्गदर्शन से लेकर मनोवैज्ञानिक साथी तक, और ग्राहक सेवा तक, इस मॉडल की मानव जैसी बातचीत क्षमता जीवन के करीब और अधिक अनुप्रयोग परिदृश्यों को जन्म दे सकती है। साथ ही, परीक्षण में इसकी उच्च सफलता दर लोगों को यह भी याद दिलाती है कि जैसे-जैसे AI अधिक "मानव जैसा" होता जा रहा है, वास्तविक और आभासी के बीच अंतर कैसे किया जाए, और इसके उपयोग को कैसे विनियमित किया जाए, यह भविष्य के समाज के लिए एक आवश्यक कार्य बन जाएगा।

यह अध्ययन AI तकनीक के तेजी से विकास के साथ प्रकाशित हुआ है। GPT-4.5 का आगमन न केवल OpenAI की तकनीकी जीत है, बल्कि मानव और मशीन के संबंधों पर एक गहरा प्रश्न भी है। जैसा कि एक प्रतिभागी ने कहा: "मुझे ऐसा लगा जैसे मैं अपने किसी दोस्त से बात कर रहा हूँ - जब तक मुझे एहसास नहीं हुआ कि यह सब कोड का जादू है।" इस मानव और AI के वार्तालाप के खेल में, असली परीक्षा शायद अभी शुरू हुई है।

शोध पत्र का पता: https://arxiv.org/pdf/2503.23674