प्रसिद्ध GPT-5 प्रोजेक्ट (कोड नाम ओरियन) को विकसित करने में 18 महीने से अधिक का समय हो चुका है, लेकिन अभी तक यह सामने नहीं आया है। वॉल स्ट्रीट जर्नल की हालिया रिपोर्ट के अनुसार, जानकारों का कहना है कि हालाँकि ओरियन का प्रदर्शन OpenAI के मौजूदा मॉडल से बेहतर है, लेकिन इसकी प्रगति इतनी नहीं है कि इसे जारी रखने के लिए भारी लागत का निवेश उचित ठहराया जा सके। इससे भी अधिक चिंताजनक यह है कि वैश्विक डेटा की कमी शायद GPT-5 को उच्च बुद्धिमत्ता स्तर पर पहुँचने में सबसे बड़ी बाधा बन रही है।

यह कहा गया है कि GPT-5 ने कम से कम दो प्रशिक्षण सत्रों का अनुभव किया है, जिनमें से प्रत्येक ने नए मुद्दों को उजागर किया है और शोधकर्ताओं की अपेक्षाओं पर खरा नहीं उतरा है। प्रत्येक प्रशिक्षण चक्र में कई महीने लगते हैं, और केवल लागत लगभग 5 करोड़ डॉलर है। यह प्रोजेक्ट सफल होगा या नहीं, और कब सफल होगा, यह अभी स्पष्ट नहीं है।

OpenAI, ChatGPT, आर्टिफिशियल इंटेलिजेंस, AI

प्रशिक्षण का मार्ग कठिनाइयों से भरा: डेटा की कमी प्रकट होती है

GPT-4 के 2023 में रिलीज़ होने के बाद, OpenAI ने GPT-5 के विकास पर ध्यान देना शुरू किया। आमतौर पर, AI मॉडल की क्षमता उस डेटा की मात्रा के साथ बढ़ती है जिसे वे अवशोषित करते हैं। प्रशिक्षण प्रक्रिया में विशाल मात्रा में डेटा की आवश्यकता होती है, जिसमें महीनों का समय लगता है और यह महंगे कंप्यूटिंग चिप्स पर निर्भर करता है। OpenAI के CEO आल्टमैन ने खुलासा किया कि केवल GPT-4 के प्रशिक्षण की लागत 1 करोड़ डॉलर से अधिक थी, जबकि भविष्य के AI मॉडल के प्रशिक्षण की लागत 10 करोड़ डॉलर से अधिक होने की उम्मीद है।

जोखिम को कम करने के लिए, OpenAI आमतौर पर पहले छोटे पैमाने पर परीक्षण संचालन करता है ताकि मॉडल की व्यवहार्यता की पुष्टि की जा सके। हालाँकि, GPT-5 का विकास शुरू से ही चुनौतियों का सामना कर रहा है। 2023 के मध्य में, OpenAI ने एक प्रयोगात्मक प्रशिक्षण शुरू किया जिसका नाम "अराकिस" है, जिसका उद्देश्य GPT-5 के नए डिज़ाइन का परीक्षण करना था। लेकिन प्रशिक्षण की प्रगति धीमी रही, और लागत बहुत अधिक थी, प्रयोगात्मक परिणामों ने दिखाया कि GPT-5 का विकास पहले से अधिक जटिल और कठिन है।

इसलिए, OpenAI की शोध टीम ने ओरियन में तकनीकी समायोजन करने का निर्णय लिया और महसूस किया कि मौजूदा सार्वजनिक इंटरनेट डेटा मॉडल की आवश्यकताओं को पूरा नहीं कर सकता है। GPT-5 के प्रदर्शन को बढ़ाने के लिए, उन्हें विभिन्न प्रकार और उच्च गुणवत्ता वाले डेटा की तत्काल आवश्यकता है।

“शून्य से डेटा बनाना”: डेटा की कमी का सामना करना

डेटा की कमी के मुद्दे का सामना करने के लिए, OpenAI ने “शून्य से डेटा बनाना” का निर्णय लिया। उन्होंने सॉफ़्टवेयर इंजीनियरों और गणितज्ञों को नियुक्त किया, नए सॉफ़्टवेयर कोड लिखने या गणितीय समस्याओं को हल करने के लिए, ताकि ओरियन इन कार्यों से सीख सके। OpenAI इन विशेषज्ञों को उनके कार्य प्रक्रिया को समझाने के लिए भी कहता है, ताकि मानव बुद्धिमत्ता को मशीन के लिए सीखने योग्य ज्ञान में परिवर्तित किया जा सके।

कई शोधकर्ताओं का मानना है कि कोड, सॉफ़्टवेयर की भाषा के रूप में, बड़े मॉडल को उनकी अनदेखी समस्याओं को हल करने में मदद कर सकता है। ट्यूरिंग कंपनी के CEO जोनाथन सिद्धार्थ ने कहा: “हम मानव बुद्धिमत्ता को मानव मस्तिष्क से मशीन मस्तिष्क में स्थानांतरित कर रहे हैं।”

OpenAI ने यहां तक कि थ्योरी भौतिकी जैसे क्षेत्रों के विशेषज्ञों के साथ सहयोग किया है, ताकि वे अपने-अपने क्षेत्रों में समस्याओं को हल करने के तरीके को समझा सकें। हालाँकि, “शून्य से डेटा बनाने” का यह तरीका प्रभावी नहीं है। GPT-4 का प्रशिक्षण डेटा लगभग 130 ट्रिलियन टोकन है, भले ही 1000 लोग प्रतिदिन 5000 शब्द लिखें, 10 करोड़ टोकन उत्पन्न करने में कई महीने लगेंगे।

प्रशिक्षण को तेज करने के लिए, OpenAI ने AI द्वारा उत्पन्न "संश्लेषण डेटा" का उपयोग करने की कोशिश की। लेकिन कुछ शोधों ने दिखाया है कि AI द्वारा उत्पन्न डेटा को AI प्रशिक्षण में पुनः उपयोग करने का फीडबैक लूप कभी-कभी मॉडल को गलतियों का कारण बन सकता है या निरर्थक उत्तर उत्पन्न कर सकता है। इस पर, OpenAI के वैज्ञानिकों का मानना है कि o1 द्वारा उत्पन्न डेटा का उपयोग करने से इन समस्याओं से बचा जा सकता है।

आंतरिक और बाहरी चुनौतियाँ: OpenAI कई चुनौतियों का सामना कर रहा है

OpenAI केवल तकनीकी चुनौतियों का सामना नहीं कर रहा है, बल्कि आंतरिक उथल-पुथल और प्रतिस्पर्धियों द्वारा खींचने की समस्याओं का भी सामना कर रहा है। साथ ही, प्रौद्योगिकी और वित्तीय दबाव भी बढ़ रहा है। प्रत्येक प्रशिक्षण की लागत 5 करोड़ डॉलर तक पहुँच जाती है, जबकि अंतिम प्रशिक्षण लागत 10 करोड़ डॉलर से अधिक हो सकती है। इस बीच, एंथ्रोपिक और गूगल जैसे प्रतिस्पर्धियों ने भी नई पीढ़ी के मॉडल को पेश करना शुरू कर दिया है, जो OpenAI को पीछे छोड़ने की कोशिश कर रहे हैं।

प्रतिभा की कमी और आंतरिक मतभेदों ने विकास की गति को और धीमा कर दिया है। पिछले साल, OpenAI की बोर्ड ने अचानक आल्टमैन को निकाल दिया, जिससे कुछ शोधकर्ताओं ने कंपनी के भविष्य पर सवाल उठाना शुरू कर दिया। हालाँकि, आल्टमैन को जल्दी ही CEO के रूप में फिर से नियुक्त किया गया और कंपनी के प्रशासनिक ढांचे में सुधार करने लगे, लेकिन इस साल, सह-संस्थापक और मुख्य वैज्ञानिक इलिया सुत्सकेवर और तकनीकी प्रमुख मिरा मुराती सहित 20 से अधिक प्रमुख कार्यकारी, शोधकर्ता और लंबे समय से कर्मचारी क्रमशः इस्तीफा दे चुके हैं।

जैसे-जैसे ओरियन प्रोजेक्ट की प्रगति रुकती है, OpenAI ने अन्य प्रोजेक्ट और अनुप्रयोगों का विकास शुरू किया है, जिसमें सरलित GPT-4 और AI वीडियो निर्माण उत्पाद सोरा शामिल हैं। लेकिन इससे विभिन्न टीमों के बीच सीमित कंप्यूटिंग संसाधनों के लिए प्रतिस्पर्धा की स्थिति बन गई, विशेष रूप से नए उत्पाद विकास टीम और ओरियन शोध टीम के बीच तीव्र प्रतिस्पर्धा हुई है।

AI विकास की बाधा? उद्योग गहन विचार का सामना कर रहा है

GPT-5 की दुविधा शायद एक बड़े उद्योग प्रश्न को उजागर करती है: क्या AI विकास की "बाधा" के करीब पहुँच चुका है? उद्योग के विशेषज्ञों का कहना है कि विशाल डेटा और बड़े मॉडल पर निर्भरता की रणनीति धीरे-धीरे विफल हो रही है। पूर्व OpenAI वैज्ञानिक सुत्सकेवर ने कहा, “हमारे पास केवल एक इंटरनेट है,” डेटा की वृद्धि धीमी हो रही है, और यह AI को तेजी से बढ़ाने वाला "फॉसिल फ्यूल" धीरे-धीरे समाप्त हो रहा है।

GPT-5 के भविष्य के बारे में, आल्टमैन ने हमेशा स्पष्ट समय सारणी नहीं दी है। हम अभी भी यह निश्चित नहीं कर सकते कि OpenAI कब या क्या एक ऐसा मॉडल पेश करेगा जिसे GPT-5 कहा जा सके। GPT-5 की इस दुविधा ने AI के भविष्य के विकास की दिशा पर गहन विचार को भी प्रेरित किया है।