OpenAI ने 12 दिनों के तकनीकी साझा लाइव कार्यक्रम के बाद, अंतिम दिन अपने अगले पीढ़ी के तर्क मॉडल o3 को जारी किया, जो पहले जारी किए गए o1 तर्क मॉडल का उन्नत संस्करण है। o3 मॉडल श्रृंखला में o3 और o3-मिनी दो संस्करण शामिल हैं, जिसमें o3-मिनी विशेष कार्यों के लिए समायोजित किया गया एक छोटा और सरल मॉडल है। OpenAI ने बताया कि o3 मॉडल कुछ स्थितियों में सामान्य कृत्रिम बुद्धिमत्ता (AGI) के करीब पहुंच सकता है, यानी यह किसी भी कार्य को पूरा कर सकता है जो मानव कर सकता है।
ARC-AGI ग्राफिकल लॉजिक रीज़निंग बेंचमार्क टेस्ट में, o3 मॉडल ने रिकॉर्ड तोड़ स्कोर प्राप्त किया, कम गणना परिदृश्यों में स्कोर 75.7% था, जबकि उच्च गणना परीक्षण में, इसने 87.5% स्कोर किया, जो मानव स्तर की पहचान करने वाले 85% के मानक से ऊपर है। इसके विपरीत, o1 मॉडल का स्कोर केवल 25% से 32% के बीच था, o3 का प्रदर्शन लगभग o1 का तीन गुना है। विश्व प्रसिद्ध कोडिंग प्रतियोगिता प्लेटफार्म Codeforces पर, o3 ने 2727 का स्कोर प्राप्त किया, जबकि o1 का स्कोर केवल 1891 था।
猎豹移动猎户星空 के अध्यक्ष傅盛 ने कहा कि OpenAI o3 का विमोचन इस बात का संकेत है कि एक ऐसा युग आने वाला है जिसमें हर कोई प्रोग्रामर बन जाएगा, उपयोगकर्ताओं को Python या C भाषा में निपुण होने की आवश्यकता नहीं होगी, वे केवल आवश्यकताएँ बताएंगे और बड़ा पूर्वानुमान मॉडल प्रोग्रामिंग कार्य पूरा करने में मदद करेगा।傅盛 का मानना है कि o3 का विमोचन यह दर्शाता है कि बड़े भाषा मॉडल की प्रोग्रामिंग क्षमताएँ 99.9% प्रोग्रामरों से आगे बढ़ गई हैं, Codeforces की विश्व स्तरीय प्रोग्रामिंग प्रतियोगिता में, o3 ने 175 की शीर्ष रैंक प्राप्त की, जबकि o1 ने केवल 90% से अधिक प्रोग्रामरों को हराया, जबकि इससे पहले GPT-4o ने केवल 11% प्रोग्रामरों को हराया।
OpenAI ने अगले साल जनवरी के अंत में o3 मॉडल को औपचारिक रूप से जारी करने की योजना बनाई है।傅盛 ने बताया कि हालांकि प्रोग्रामर पूरी तरह से गायब नहीं होंगे, लेकिन उनका काम अधिकतर उपयोगकर्ता की आवश्यकताओं को समझने और बड़ी तर्क संरचना बनाने की ओर बढ़ेगा, जबकि आवश्यकताओं को कोड में बदलने का काम AI द्वारा बड़े पैमाने पर किया जाएगा। यह विमोचन यह दर्शाता है कि AI प्रोग्रामिंग क्षेत्र में और अधिक व्यापक रूप से लागू होगा, और यह प्रोग्रामरों के काम करने के तरीके को भी बदल सकता है।