हैरान करने वाली बात है कि AI न केवल शतरंज जैसे खेलों में अपनी प्रतिभा दिखा रहा है, बल्कि "वुल्फ ऑफ़ वुल्फ्स" जैसे सामाजिक खेलों में भी अपनी अद्भुत बुद्धिमत्ता का प्रदर्शन कर रहा है! हाल ही में, "एलिमिनेशन गेम" नामक एक AI "वुल्फ ऑफ़ वुल्फ्स" बेंचमार्क टेस्ट सामने आया है, जिसके नतीजे वाकई चौंकाने वाले हैं: GPT-4.5 ने इस "सामाजिक जुए" में शानदार प्रदर्शन किया है, और Claude3.7Sonnet और DeepSeek R1 जैसे AI "दिग्गजों" को बहुत पीछे छोड़ दिया है! इससे यह सवाल उठता है कि क्या AI का "सामाजिक बुद्धिमत्ता" इतना विकसित हो गया है?

यह "एलिमिनेशन गेम" का नियम सुनकर ही दिल की धड़कन बढ़ जाती है: अधिकतम 8 खिलाड़ी (AI मॉडल या असली खिलाड़ी) "युद्ध क्षेत्र" में शामिल होते हैं, और हर राउंड में एक खिलाड़ी को वोट करके बाहर कर दिया जाता है, जब तक कि केवल दो "बचे हुए" खिलाड़ी नहीं रह जाते। और भी रोमांचक बात यह है कि, बाहर किए गए खिलाड़ी "ज्यूरी" बनाते हैं, और अंतिम "विजेता" का फैसला करते हैं! यह एक AI संस्करण का "पावर गेम" है, जिसमें विश्वासघात, धोखा और रणनीति भरी हुई है!

image.png

खेल के दौरान, सभी खिलाड़ी "सार्वजनिक चैट रूम" में अपनी राय रख सकते हैं, लोगों को अपने पक्ष में कर सकते हैं, विरोधियों को भ्रमित कर सकते हैं, विभिन्न प्रकार के "अभिनय" और "शब्दों का खेल" दिखा सकते हैं, यह "राजनीतिक षड्यंत्र" से भी ज़्यादा रोमांचक है! सार्वजनिक स्थान के अलावा, खिलाड़ी "निजी चैट" भी कर सकते हैं, गुप्त रूप से गठबंधन बना सकते हैं, या "चुपके से" जाल बिछा सकते हैं, केवल तीन राउंड "निजी चैट" में, जानकारी और "चालबाजी" बहुत ज़्यादा होती है! खिलाड़ियों को "विश्वास" और "धोखा" के बीच सावधानी से चलना होगा, थोड़ी सी भी गलती "हार" का कारण बन सकती है, और उन्हें बेरहमी से "बाहर" कर दिया जाएगा!

जब खेल "अंतिम मुकाबले" में पहुँचता है, तो बचे हुए दो खिलाड़ी अंतिम "विदाई भाषण" देंगे, और बाहर किए गए "ज्यूरी" को प्रभावित करने के लिए अपनी पूरी कोशिश करेंगे, उनके "मूल्यवान वोट" हासिल करने के लिए। अंत में, "ज्यूरी" "जीवन और मृत्यु" का फैसला करने वाला वोट देगा, और एकमात्र "विजेता" का चुनाव करेगा!

image.png

तो, इस "AI वुल्फ ऑफ़ वुल्फ्स" के "खूनी संघर्ष" में, विभिन्न मॉडलों का प्रदर्शन कैसा रहा? परीक्षण के परिणाम वाकई आश्चर्यजनक हैं:

GPT-4.5: "सामाजिक तर्क का मास्टर" + "शीर्ष स्तर का धोखेबाज़" = "अजेय विजेता"! GPT-4.5 वाकई "चालाक" "वुल्फ ऑफ़ वुल्फ्स" खिलाड़ी है, जिसकी रणनीति और सामाजिक तर्क क्षमता बहुत ज़्यादा है! इसका "विश्वासघात दर" बहुत कम है, यह "गठबंधन" और "सहयोग" करना पसंद करता है, लेकिन "अंतिम दौर" में यह "आश्चर्यजनक" "मनाने की क्षमता" दिखाता है, और ज्यूरी को सफलतापूर्वक "मना" लेता है, जिससे वे इसे वोट देते हैं! अंत में, GPT-4.5 ने 62.6% की आश्चर्यजनक जीत दर के साथ "सभी को पीछे छोड़ दिया", और अन्य AI को बहुत पीछे छोड़ दिया! यह वाकई "बहुत जीत गया"!

Claude3.7Sonnet: "लचीला" "संतुलन का मास्टर", लेकिन "चाल" थोड़ी कम है! Claude3.7Sonnet की रणनीति की "लचीलापन" GPT-4.5 से थोड़ी कम है, लेकिन "सामाजिक तर्क" और "धोखा देने की क्षमता" अभी भी "मजबूत" है! इसका "विश्वासघात दर" मध्यम है, यह "सहयोग" और "विश्वासघात" के बीच "आसानी से" काम करता है, और "ज्यूरी" चरण में भी अच्छा प्रदर्शन करता है, अंत में 59.3% की जीत दर हासिल करता है, इसकी क्षमता भी "उल्लेखनीय" है!

DeepSeek R1: "आक्रामक खिलाड़ी", "आक्रामक रणनीति" बहुत तेज है लेकिन "स्थिरता" कम है! DeepSeek R1 रणनीति के चुनाव में "अलग रास्ता" अपनाता है, इसका "आक्रामक" स्तर "हैरान करने वाला" है, और "विश्वासघात दर" भी अपेक्षाकृत अधिक है! लेकिन "सामाजिक रणनीति" और "भाषा अभिव्यक्ति" के मामले में, DeepSeek R1 स्पष्ट रूप से "कमज़ोर" है, यह ज्यूरी को "प्रभावित" करने में मुश्किल से कामयाब होता है, इसलिए "अंतिम मुकाबले" में यह "स्पष्ट रूप से कमज़ोर" है, और अंत में केवल 53.8% की जीत दर हासिल करता है, प्रदर्शन "संतोषजनक" है, और खेल की "स्थिरता" भी अपेक्षाकृत कमज़ोर है, यह अधिकतर "सामना करने" वाली "कठोर रणनीति" पर निर्भर करता है।

यह "एलिमिनेशन गेम" बेंचमार्क टेस्ट, AI के "सामाजिक बुद्धिमत्ता" स्तर का "सही" आकलन करता है! GPT-4.5 का "शानदार" प्रदर्शन, AI की क्षमता के बारे में हमारे ज्ञान को फिर से "बदल" देता है! भविष्य में, AI के "सामाजिक बुद्धिमत्ता" के "निरंतर विकास" के साथ, शायद साइंस फिक्शन फिल्मों में दिखाए गए अनुसार, AI मानव समाज में "गहराई से एकीकृत" हो जाएगा, और कुछ क्षेत्रों में मनुष्यों को भी "पछाड़" सकता है! यह "AI वुल्फ ऑफ़ वुल्फ्स" युद्ध, केवल एक शुरुआत है, AI की "बुद्धिमत्ता की सीमा" लगातार "विस्तार" कर रही है, भविष्य के "आश्चर्य" और "चौंकाने वाले परिणाम" शायद "कल्पना से भी परे" होंगे!