कृत्रिम बुद्धिमत्ता के क्षेत्र में एक महत्वपूर्ण मानक, ARC-AGI, यानी "सामान्य कृत्रिम बुद्धिमत्ता का अमूर्त और तर्क सामग्री भंडार", जल्द ही एक महत्वपूर्ण प्रगति करने वाला है। हालांकि, परीक्षण के संस्थापक फ्रैंकोइस चोललेट ने चेतावनी दी है कि, भले ही परिणाम बेहतर हुए हैं, यह इस बात का संकेत नहीं है कि हम सामान्य कृत्रिम बुद्धिमत्ता (AGI) को प्राप्त करने के करीब हैं। उन्होंने指出 कि इस परीक्षण में खुद कुछ डिज़ाइन दोष हैं, और यह जो प्रकट करता है वह वास्तव में अनुसंधान में कोई महत्वपूर्ण प्रगति नहीं है।
2019 में चोललेट द्वारा ARC-AGI की शुरुआत के बाद से, AI सिस्टम ने परीक्षण में लगातार खराब प्रदर्शन किया है, अब तक, सबसे अच्छे प्रदर्शन वाले सिस्टम ने केवल एक तिहाई कार्यों को हल किया है। चोललेट ने कहा कि यह मुख्य रूप से वर्तमान कृत्रिम बुद्धिमत्ता अनुसंधान के बड़े भाषा मॉडलों (LLM) पर अत्यधिक निर्भरता के कारण है। उन्होंने指出 कि LLM बड़े पैमाने पर डेटा को संसाधित करते समय पैटर्न पहचानने में सक्षम होते हैं, लेकिन ये याददाश्त पर निर्भर होते हैं, तर्क पर नहीं, इसलिए नए अप्रत्याशित परिस्थितियों को संभालना या वास्तव में "तर्क" करना मुश्किल होता है।
“LLM मॉडल प्रशिक्षण डेटा से पैटर्न निकालने पर निर्भर करते हैं, स्वतंत्र तर्क करने के बजाय। वे केवल पैटर्न 'याद' करते हैं, नए तर्क उत्पन्न नहीं करते।” चोललेट ने सोशल मीडिया प्लेटफॉर्म X पर एक श्रृंखला में पोस्ट में समझाया।
फिर भी, चोललेट ने AI अनुसंधान को आगे बढ़ाने से नहीं रोका। उन्होंने और ज़ापियर के संस्थापक माइक नूप ने इस वर्ष जून में एक मिलियन डॉलर की प्रतियोगिता शुरू की, जो ओपन-सोर्स AI को ARC-AGI मानक को चुनौती देने के लिए प्रोत्साहित करती है। हालाँकि, 17,789 प्रविष्टियों में, सबसे अच्छा प्रदर्शन करने वाले AI सिस्टम ने केवल 55.5% स्कोर प्राप्त किया, जो "मानव स्तर" प्राप्त करने के लिए आवश्यक 85% मानक से कम है, लेकिन चोललेट और नूप अभी भी इसे एक महत्वपूर्ण कदम मानते हैं।
नूप ने एक ब्लॉग पोस्ट में指出 किया कि यह परिणाम इस बात का संकेत नहीं है कि हम AGI को प्राप्त करने के करीब हैं, बल्कि यह ARC-AGI में कुछ कार्यों के "बलात्कारी" समाधान पर अत्यधिक निर्भरता को उजागर करता है, जो वास्तव में सामान्य बुद्धिमत्ता के लिए प्रभावी संकेत नहीं दे सकता। ARC-AGI का डिज़ाइन इस उद्देश्य से था कि AI की सामान्यीकरण क्षमता का परीक्षण करने के लिए जटिल, पहले कभी नहीं देखे गए कार्यों को प्रदान किया जाए, लेकिन क्या ये कार्य AGI का प्रभावी मूल्यांकन कर सकते हैं, यह अभी भी संदिग्ध है।
चित्र स्रोत नोट: चित्र AI द्वारा उत्पन्न, चित्र अधिकार सेवा प्रदाता Midjourney
ARC-AGI मानक में कार्यों में जैसे पहेली समस्याएँ शामिल हैं, जो AI से ज्ञात जानकारी के आधार पर अज्ञात उत्तर का अनुमान लगाने की मांग करती हैं। हालांकि ये कार्य AI को नई परिस्थितियों के अनुकूल होने के लिए प्रेरित कर सकते हैं, लेकिन परिणाम बताते हैं कि मौजूदा मॉडल समाधान खोजने के लिए भारी गणना का उपयोग करते हैं, न कि वास्तव में बुद्धिमान अनुकूलन क्षमता का प्रदर्शन करते हैं।
इसके अलावा, ARC-AGI के निर्माताओं को अपने समकक्षों से आलोचना का सामना करना पड़ रहा है, विशेष रूप से AGI की परिभाषा के संदर्भ में अस्पष्टता के लिए। OpenAI के एक कर्मचारी ने हाल ही में कहा कि यदि AGI को "अधिकतर कार्यों में अधिकांश मनुष्यों से बेहतर प्रदर्शन करने वाली कृत्रिम बुद्धिमत्ता" के रूप में परिभाषित किया जाए, तो AGI वास्तव में पहले से ही प्राप्त हो चुका है। हालाँकि, चोललेट और नूप का मानना है कि ARC-AGI मानक की वर्तमान डिज़ाइन इस लक्ष्य को पूरी तरह से प्राप्त नहीं करती है।
भविष्य की ओर देखते हुए, चोललेट और नूप दूसरे पीढ़ी के ARC-AGI मानक को जारी करने की योजना बना रहे हैं, और 2025 में नए परीक्षण आयोजित करेंगे, ताकि वर्तमान परीक्षण की कमियों को दूर किया जा सके। उन्होंने कहा कि नया मानक AI अनुसंधान को और अधिक महत्वपूर्ण दिशा में आगे बढ़ाने पर अधिक ध्यान केंद्रित करेगा, AGI की प्राप्ति की प्रक्रिया को तेज करेगा।
हालांकि, मौजूदा मानक को सुधारना आसान काम नहीं है। चोललेट और नूप का प्रयास दर्शाता है कि कृत्रिम बुद्धिमत्ता की बुद्धिमत्ता की परिभाषा, विशेष रूप से सामान्य बुद्धिमत्ता के क्षेत्र में, अभी भी एक कठिन और जटिल कार्य है।