OpenAI द्वारा हाल ही में लॉन्च किया गया o3AI मॉडल इसके सबसे शक्तिशाली आर्टिफिशियल इंटेलिजेंस उत्पादों में से एक माना जाता है, लेकिन इसके संचालन की लागत चौंकाने वाली है, एकल कार्य की लागत 1000 डॉलर से अधिक है।
TechCrunch की रिपोर्ट के अनुसार, यह नया मॉडल जटिल समस्याओं को हल करने के लिए "टेस्टिंग टाइम कम्प्यूटिंग" नामक तकनीक का उपयोग करता है, जिसका मतलब है कि यह उत्तर प्राप्त करने से पहले अधिक समय सोचने और विभिन्न संभावनाओं की खोज में व्यतीत करता है। इसलिए, OpenAI के इंजीनियरों को उम्मीद है कि o3 जटिल संकेतों के तहत बेहतर प्रतिक्रिया उत्पन्न कर सकेगा।
ARC-AGI बेंचमार्क टेस्ट के संस्थापक François Chollet के अनुसार, o3 ने अपने शक्तिशाली "हाई कम्प्यूटिंग मोड" में 87.5% स्कोर किया, जो पिछले जनरेशन o1 मॉडल के 32% स्कोर का लगभग तीन गुना है। यह दर्शाता है कि o3 में प्रदर्शन में महत्वपूर्ण सुधार हुआ है। हालाँकि, इस बारीक गणना प्रक्रिया के साथ भारी खर्च जुड़ा हुआ है। इस उच्च स्कोर को प्राप्त करने के लिए, o3 की गणना लागत प्रति कार्य 1000 डॉलर से अधिक है, और इसका उपयोग की जाने वाली गणना क्षमता लो-पावर संस्करण o3 की तुलना में 170 गुना अधिक है, जो इसके पूर्ववर्ती के प्रति कार्य की लागत 4 डॉलर से कम थी।
यह स्थिति उद्योग में o3 मॉडल के प्रदर्शन और इसकी संचालन लागत के बीच के अंतर्विरोध पर ध्यान आकर्षित करती है। एक ओर, o3 के स्कोर में भारी वृद्धि यह साबित करती है कि आर्टिफिशियल इंटेलिजेंस मॉडल "स्केलिंग" विधि के माध्यम से, अर्थात् प्रोसेसिंग क्षमता और प्रशिक्षण डेटा को बढ़ाकर, अभी भी प्रगति प्राप्त कर सकते हैं। लेकिन दूसरी ओर, स्केलिंग से होने वाले लाभ में कमी के प्रति आलोचना की आवाजें भी बढ़ रही हैं। हालाँकि o3 में सुधार मुख्य रूप से इसके "इनफेरेंस" विधि में सुधार के कारण है, न कि केवल स्केलिंग के कारण, लेकिन इसकी उच्च संचालन लागत निश्चित रूप से चिंता का विषय है।
यहाँ तक कि o3 का लो-कम्प्यूटेशन वर्जन, बेंचमार्क टेस्ट में 76% स्कोर करता है, लेकिन प्रति कार्य की लागत लगभग 20 डॉलर तक पहुँच गई है, जो तुलनात्मक रूप से एक सस्ता विकल्प है, लेकिन इसके पूर्ववर्ती उत्पाद की तुलना में कई गुना महंगा है। और, ChatGPT Plus की मासिक लागत केवल 25 डॉलर होने के कारण, OpenAI को उपयोगकर्ताओं के उपयोग के स्तर को बढ़ाने में भारी लागत दबाव का सामना करना पड़ रहा है।
बेंचमार्क टेस्ट परिणामों पर एक ब्लॉग में, Chollet ने कहा कि, हालाँकि o3 मानव प्रदर्शन स्तर के करीब है, "लागत अभी भी बहुत अधिक है, यह आर्थिक रूप से व्यवहार्य नहीं है।" उन्होंने बताया कि ARC-AGI कार्यों को हल करने की मानव श्रम लागत लगभग 5 डॉलर प्रति कार्य है, जबकि ऊर्जा लागत केवल कुछ सेंट है। हालाँकि, उन्होंने आशावाद व्यक्त किया कि "लागत प्रभावशीलता आने वाले महीनों और वर्षों में महत्वपूर्ण रूप से सुधर सकती है।" वर्तमान में, o3 अभी तक जनता के लिए जारी नहीं किया गया है, और इसकी "मिनी वर्जन" अगले वर्ष जनवरी में लॉन्च होने की उम्मीद है।
मुख्य बिंदु:
🌟 o3AI मॉडल की एकल क्वेरी लागत 1000 डॉलर से अधिक है, जो इसके संचालन की उच्च लागत को दर्शाता है।
📊 ARC-AGI बेंचमार्क टेस्ट में, o3 ने 87.5% स्कोर किया, जो पिछले जनरेशन o1 मॉडल के स्कोर का लगभग तीन गुना है।
🔍 वर्तमान में o3 जनता के लिए जारी नहीं किया गया है, और इसकी "मिनी वर्जन" अगले वर्ष जनवरी में लॉन्च होने की उम्मीद है।