OpenAI के शोधकर्ताओं ने गुरुवार को CriticGPT की घोषणा की, जो एक नवोन्मेषी AI मॉडल है, जिसे ChatGPT द्वारा उत्पन्न कोड में त्रुटियों की पहचान और सुधार के लिए डिज़ाइन किया गया है। यह महत्वपूर्ण प्रगति कृत्रिम बुद्धिमत्ता प्रौद्योगिकी में आत्म-सुधार और गुणवत्ता नियंत्रण के क्षेत्र में एक महत्वपूर्ण कदम का प्रतीक है।
CriticGPT की मुख्य विशेषताएँ
1. GPT-4 श्रृंखला पर आधारित: CriticGPT शक्तिशाली GPT-4 भाषा मॉडल के आधार पर विकसित किया गया है।
2. कोड समीक्षा पर ध्यान केंद्रित: मुख्य रूप से ChatGPT द्वारा उत्पन्न प्रोग्रामिंग कोड का विश्लेषण करने और संभावित त्रुटियों को इंगित करने के लिए उपयोग किया जाता है।
3. मानव-मशीन सहयोग: मानव प्रशिक्षकों के AI सहायक के रूप में, कोड समीक्षा की दक्षता और सटीकता को बढ़ाता है।
4. सुदृढ़न सीखना: मानव प्रतिक्रिया से सीखकर AI प्रणाली के "संरेखण" के स्तर को बढ़ाता है।
विकास प्रक्रिया और परिणाम
शोधकर्ताओं ने CriticGPT विकसित करने के लिए नवोन्मेषी प्रशिक्षण विधियों का उपयोग किया:
1. डेटा सेट की तैयारी: जानबूझकर त्रुटियों वाले कोड नमूनों का उपयोग करके प्रशिक्षण।
2. मानव सहभागिता: मानव प्रशिक्षकों से ChatGPT द्वारा लिखित कोड में संशोधन करने, त्रुटियाँ जोड़ने और प्रतिक्रिया देने का अनुरोध किया गया।
3. नई तकनीक का अनुप्रयोग: "फोर्स्ड सैंपलिंग बीम सर्च" (FSBS) तकनीक को शामिल किया गया, जो विस्तृत टिप्पणियों और काल्पनिक समस्याओं के उत्पादन के बीच संतुलन बनाता है।
प्रयोगात्मक परिणाम दर्शाते हैं:
- 63% स्वाभाविक रूप से उत्पन्न त्रुटि मामलों में, मानव CriticGPT की आलोचना को अधिक पसंद करते हैं।
- CriticGPT ने बेकार की "निगरानी" और झूठी रिपोर्ट/भ्रम की समस्याओं को कम किया।
- 24% पहले पूर्ण समझे जाने वाले मामलों में, CriticGPT ने सफलतापूर्वक त्रुटियों की पहचान की और उन्हें मान्यता दी।
संभावित अनुप्रयोग और सीमाएँ
हालांकि CriticGPT मुख्य रूप से कोड समीक्षा के लिए है, शोध से पता चलता है कि इसे गैर-कोड कार्यों में भी लागू किया जा सकता है। हालाँकि, इस मॉडल के कुछ सीमाएँ भी हैं:
1. मुख्य रूप से छोटे ChatGPT उत्तरों पर प्रशिक्षित किया गया है, जो अधिक जटिल कार्यों के लिए उपयुक्त नहीं हो सकता।
2. हालाँकि झूठी गतिविधियों को कम किया गया है, लेकिन इसे पूरी तरह से समाप्त नहीं किया जा सका।
3. कई भागों में फैली हुई त्रुटियों की पहचान में अभी भी सुधार की आवश्यकता है।
भविष्य की संभावनाएँ
OpenAI CriticGPT जैसे मॉडलों को अपने RLHF टैगिंग पाइपलाइन में एकीकृत करने की योजना बना रहा है, ताकि प्रशिक्षकों को AI सहायता प्रदान की जा सके। यह बड़े भाषा मॉडल (LLM) के आउटपुट के मूल्यांकन के उपकरण विकास में महत्वपूर्ण प्रगति का प्रतिनिधित्व करता है। हालाँकि, शोधकर्ताओं ने यह भी रेखांकित किया कि AI सहायता के साथ भी, अत्यधिक जटिल कार्य मानव मूल्यांकनकर्ताओं के लिए अभी भी चुनौतीपूर्ण हैं।
जैसे-जैसे AI तकनीक में निरंतर प्रगति हो रही है, CriticGPT जैसे नवोन्मेष AI प्रणालियों की सटीकता और विश्वसनीयता को बढ़ाने में महत्वपूर्ण भूमिका निभाएंगे, और AI को मानव आवश्यकताओं के साथ और अधिक संरेखित करने में मदद करेंगे।
पता: https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/