हाल ही में, OpenAI ने "स्ट्रॉबेरी" योजना के रहस्य को चुपचाप उजागर किया है। इस परियोजना को पहले Q* के नाम से जाना जाता था, अब यह स्ट्रॉबेरी के रूप में फिर से सामने आई है, और कहा जाता है कि यह AI को कार्यों की योजना बनाने, स्वतंत्र रूप से इंटरनेट पर जानकारी इकट्ठा करने, और यहां तक कि गहन शोध करने में सक्षम बनाएगी।

यहां तक कि तकनीकी क्षेत्र के बड़े नाम एलोन मस्क भी चुप नहीं रह सके, उन्होंने टिप्पणी में मजाक करते हुए कहा: "मुझे लगता था कि AI का अंत पेपरक्लिप आपदा से होगा, लेकिन अब लगता है कि यह अंतहीन स्ट्रॉबेरी खेत हो सकता है।"

image.png

हालांकि बाहरी दुनिया स्ट्रॉबेरी योजना के प्रति जिज्ञासु है, OpenAI इसके संचालन विवरण को गुप्त रखता है। इस परियोजना का विकास प्रक्रिया कंपनी के भीतर अत्यधिक गोपनीय है, यहां तक कि इसकी रिलीज़ का समय भी एक रहस्य बन गया है।

हाल ही में एक आंतरिक बैठक में, OpenAI ने स्ट्रॉबेरी योजना का एक डेमो संस्करण प्रस्तुत किया, जिसकी तर्क क्षमता इतनी मजबूत है कि यह लगभग मानव के समान है। यह उनके हाल ही में घोषित AGI रोडमैप के साथ मेल खाता है, जिससे यह संदेह होता है कि क्या OpenAI कुछ बड़ा करने की योजना बना रहा है।

स्ट्रॉबेरी मॉडल का डिज़ाइन सिद्धांत यह है कि AI न केवल प्रश्नों के उत्तर उत्पन्न कर सके, बल्कि पहले से योजना बना सके, स्वतंत्र और विश्वसनीय तरीके से इंटरनेट ब्राउज़ कर सके, और所谓的 "गहन शोध" कर सके। वर्तमान में, AI क्षेत्र में यह क्षमता पहली बार है।

जानकारों के अनुसार, OpenAI की स्ट्रॉबेरी योजना स्टैनफोर्ड विश्वविद्यालय द्वारा विकसित एक विधि के समान है - "स्व-शिक्षण तर्ककर्ता" (संक्षिप्त में STaR)। STaR डेटा के छोटे सेट का उपयोग करके अपने आप को सुधारने के लिए पुनरावृत्ति के माध्यम से प्रशिक्षण डेटा बनाता है।

image.png

पत्र का पता: https://arxiv.org/pdf/2203.14465

वर्तमान में, AI को तर्क प्रक्रिया उत्पन्न करने के लिए उपयोग की जाने वाली विधियाँ या तो महंगी हैं या सटीकता को बलिदान करती हैं। लेकिन STaR तकनीक पुनरावृत्ति के माध्यम से कम तर्क उदाहरणों और बड़ी संख्या में गैर-तर्क डेटा का उपयोग करके AI को आत्म-सुधार करने देती है।

STaR तकनीक का कार्यप्रवाह इस प्रकार है: पहले, AI कई प्रश्नों के उत्तर देने का प्रयास करता है और तर्क प्रक्रिया उत्पन्न करता है। यदि उत्तर गलत है, तो सही उत्तर के ज्ञान के साथ तर्क को फिर से उत्पन्न करता है। फिर, सभी सही उत्तर वाले तर्क को समायोजित किया जाता है और इस प्रक्रिया को दोहराया जाता है।

OpenAI उम्मीद करता है कि स्ट्रॉबेरी का नवाचार AI मॉडल की तर्क क्षमता को महत्वपूर्ण रूप से बढ़ा सकेगा। इसमें एक विशेष प्रक्रिया शामिल है - जब AI मॉडल को बड़े पैमाने पर डेटा पूर्व-प्रशिक्षण के बाद, प्रदर्शन को अनुकूलित करने के लिए समायोजित किया जाता है।

OpenAI यह भी चाहता है कि स्ट्रॉबेरी लंबी अवधि के कार्य (LHT) को निष्पादित कर सके, जिसके लिए मॉडल को पहले से योजना बनानी और एक श्रृंखला में कार्यों को निष्पादित करना होगा। इस लक्ष्य को प्राप्त करने के लिए, वे "गहन शोध" डेटा सेट बना और मूल्यांकन कर रहे हैं।

जैसे-जैसे स्ट्रॉबेरी योजना धीरे-धीरे आगे बढ़ रही है, OpenAI AGI के लक्ष्य को प्राप्त करने के करीब पहुंच रहा है। यदि स्ट्रॉबेरी की तर्क क्षमता वास्तव में मानव के समान हो जाती है, तो AI का भविष्य अनंत होगा।