2024 के उच्च शिक्षा परीक्षा सत्र में, नौ AI बड़े मॉडल ने एक अभूतपूर्व चुनौती का सामना किया - उच्च शिक्षा परीक्षा में भाग लेना, विशेष रूप से अत्यधिक कठिन नए पाठ्यक्रम I पेपर: हेनान पेपर। इस परीक्षण का आयोजन मीडिया द्वारा किया गया, जिसने न केवल AI की शैक्षणिक क्षमता का परीक्षण किया, बल्कि हमें AI और मानव बुद्धिमत्ता के बीच के अंतर को देखने का एक अनूठा दृष्टिकोण भी प्रदान किया।
परीक्षण में शामिल 9 AI में से, 4 AI ने हेनेन उच्च शिक्षा परीक्षा के पहले स्तर के स्कोर को पार किया। GPT-4o ने 562 अंकों के उच्च स्कोर के साथ पहला स्थान प्राप्त किया, जो पहले स्तर से 41 अंक अधिक है, जबकि बाइटडांस का डौबाओ 542.5 अंकों के साथ दूसरे स्थान पर रहा, जो घरेलू मॉडलों में एक उत्कृष्टता है।
चित्र स्रोत नोट: चित्र AI द्वारा उत्पन्न, चित्र अधिकृत सेवा प्रदाता Midjourney द्वारा
AI ने मानविकी विषयों में उत्कृष्ट प्रदर्शन किया, विशेष रूप से भाषा और अंग्रेजी विषयों में, जबकि विज्ञान विषयों, विशेष रूप से गणित में, प्रदर्शन अपेक्षाकृत कमजोर रहा। देखा जा सकता है कि AI ने भाषा विषयों में स्पष्ट लाभ दिखाया है, और古诗文 की समझ क्षमता प्रभावशाली रही है।
सरल तर्क प्रश्नों पर AI का प्रदर्शन संतोषजनक रहा, लेकिन जटिल व्युत्पत्ति और प्रमाण की आवश्यकता वाले प्रश्नों पर प्रदर्शन खराब रहा, जिससे यह स्पष्ट होता है कि तर्क क्षमता में सुधार की आवश्यकता है। मानविकी में, भूगोल विषय का प्रदर्शन सबसे खराब रहा, जबकि विज्ञान में, जीव विज्ञान विषय का प्रदर्शन अपेक्षाकृत अच्छा रहा। GPT-4o ने राजनीति विषय में 91.5 अंकों के उच्च स्कोर के साथ उत्कृष्ट प्रदर्शन किया।
परीक्षण विधि और स्कोरिंग मानदंड
परीक्षण राउंड: यादृच्छिकता के प्रभाव को कम करने के लिए, सभी विषयों के लिए दो राउंड के परीक्षण किए गए और अंतिम स्कोर के रूप में औसत अंक लिए गए।
इनपुट प्रारूप: सूत्रों को Markdown/LaTeX प्रारूप में इनपुट किया गया, छवि प्रश्नों के लिए मॉडल की पहचान क्षमता के अनुसार संबंधित चित्र और पाठ इनपुट किए गए।
परीक्षण संचालन: पेशेवर AI डेटा सेवा प्रदाता द्वारा मानकीकृत परीक्षण स्क्रीनशॉट लिए गए, जिसने परीक्षण की निष्पक्षता सुनिश्चित की।
स्कोरिंग विधि: मानव परीक्षार्थियों के लिए एक समान स्कोरिंग मानदंड का उपयोग किया गया, जिसने स्कोरिंग की निष्पक्षता सुनिश्चित की।
AI द्वारा उच्च शिक्षा परीक्षा में भाग लेने का यह प्रयास न केवल AI के विशिष्ट क्षेत्रों में लाभों को प्रदर्शित करता है, बल्कि तर्कात्मक विचार और गणितीय प्रमाण के क्षेत्रों में इसकी कमियों को भी उजागर करता है। जैसे कि एक AI परीक्षार्थी ने निबंध में उद्धृत किया: “मार्ग लंबा और कठिन है, मैं ऊपर-नीचे खोज करूंगा।” यह न केवल AI के विकास का चित्रण है, बल्कि मानवता द्वारा अज्ञात दुनिया की निरंतर खोज का जीवंत वर्णन भी है। इस परीक्षण के माध्यम से, हमें AI की बुद्धिमत्ता के स्तर के बारे में अधिक गहरी समझ मिली है, और AI के भविष्य के विकास दिशा के लिए मूल्यवान संदर्भ प्रदान किया है।
परीक्षार्थियों की सूची में OpenAI का GPT-4o, बाइटडांस का डौबाओ, बाइडू का वेंक्सिन 4.0 जैसे प्रसिद्ध AI उत्पाद शामिल हैं, जिनका इस उच्च शिक्षा परीक्षा में प्रदर्शन निश्चित रूप से AI तकनीक के विकास पर गहरा प्रभाव डालेगा।