OpenAI जल्द ही ChatGPT के लिए एक बड़ा अपडेट लाने वाला है। खबरों के अनुसार, $200/माह की कीमत वाला ChatGPT Pro आधिकारिक रूप से लॉन्च हो गया है, हालांकि वर्तमान में कोई नई सुविधाएँ या मॉडल पेश नहीं किए गए हैं, लेकिन उपयोगकर्ता अगले दो सप्ताह में एक नए "स्ट्रॉबेरी" मॉडल का अनुभव करने की उम्मीद कर सकते हैं। यह अपेक्षित AI मॉडल न केवल ChatGPT को मजबूत तकनीकी समर्थन प्रदान करेगा, बल्कि इसकी अद्वितीय तर्क करने की शैली उद्योग में ध्यान आकर्षित करेगी।
"स्ट्रॉबेरी" मॉडल की मुख्य विशेषता मानव सोच प्रक्रिया की नकल करने की क्षमता है। यह उत्तर देने से पहले 10 से 20 सेकंड तक "सोचने" और जानकारी खोजने में समय लेता है, यह नवोन्मेषी प्रक्रिया AI की गणनात्मक शक्ति के उपयोग की दक्षता को बढ़ाने के लिए डिज़ाइन की गई है, जिससे अधिक सटीक सामग्री उत्पन्न की जा सके।
हालांकि, यह ध्यान देने योग्य है कि "स्ट्रॉबेरी" मॉडल प्रारंभ में केवल पाठ संसाधन का समर्थन करता है और GPT-4 की तरह छवि और ऑडियो प्रसंस्करण क्षमताएँ नहीं हैं।
वास्तव में, यह लंबी तर्क समय और अनुकूलन तकनीक OpenAI की पहली खोज नहीं है। गूगल DeepMind पहले ही इस क्षेत्र में गहन अनुसंधान कर चुका है और संबंधित पत्र प्रकाशित कर चुका है। शोधकर्ताओं ने पाया कि "परीक्षण के समय गणना" तकनीक का उपयोग करके बड़े भाषा मॉडल के प्रदर्शन को काफी बढ़ाया जा सकता है, जो वर्तमान मॉडल की प्रशिक्षण डेटा सेट और तर्क गणना संसाधनों की सीमाओं को पार कर सकता है।
"स्ट्रॉबेरी" मॉडल की अनुकूलन रणनीतियाँ मुख्य रूप से दो प्रकार की हैं। पहली प्रकार एक घनिष्ठ, प्रक्रिया-उन्मुख सत्यापन पुरस्कार मॉडल पर आधारित है, जो मॉडल से केवल परिणाम उत्पन्न करने की नहीं, बल्कि तर्क प्रक्रिया प्रदान करने की भी मांग करती है, जो विशेष रूप से जटिल गणितीय और तार्किक तर्क कार्यों के लिए उपयुक्त है।
दूसरी रणनीति पहले उत्पन्न सामग्री के आधार पर आगे के उत्तरों को गतिशील रूप से समायोजित करना है, जो कई दौरों में पुनरावृत्ति करके आउटपुट गुणवत्ता को निरंतर अनुकूलित करती है। शोधकर्ताओं द्वारा प्रस्तावित "गणना अनुकूल" रणनीति का उद्देश्य विशिष्ट परिस्थितियों के अनुसार सबसे उपयुक्त परीक्षण समय गणना विधि का चयन करना है, जिससे गणना की दक्षता में काफी सुधार होता है।
हालांकि, "स्ट्रॉबेरी" मॉडल कुछ चुनौतियों का सामना भी कर रहा है। हालांकि यह गलतियों और भ्रम को कम करने में उत्कृष्ट प्रदर्शन करता है, 10 से 20 सेकंड का प्रतिक्रिया समय उपयोगकर्ता अनुभव को प्रभावित कर सकता है। कुछ परीक्षणकर्ताओं ने बताया कि ये थोड़े अधिक सटीक उत्तर लंबे प्रतीक्षा समय की भरपाई करने के लिए पर्याप्त नहीं हैं।
इसके अलावा, चूंकि उन्नत क्षमताओं के कारण अधिक गणनात्मक संसाधनों की खपत हो सकती है, उपयोग की लागत भी बढ़ सकती है। उपयोगकर्ता अनुभव और संसाधन खपत के बीच संतुलन बनाने के लिए, OpenAI संदेश भेजने की आवृत्ति पर सीमा निर्धारित कर सकता है, साथ ही तेजी से प्रतिक्रिया गति प्रदान करने के लिए उच्च मूल्य की योजनाओं को पेश करने पर विचार कर सकता है।