OpenAI के शोधकर्ताओं ने गुरुवार को CriticGPT की घोषणा की, जो एक नवोन्मेषी AI मॉडल है, जिसे ChatGPT द्वारा उत्पन्न कोड में त्रुटियों की पहचान और सुधार के लिए डिज़ाइन किया गया है। यह महत्वपूर्ण प्रगति कृत्रिम बुद्धिमत्ता प्रौद्योगिकी में आत्म-सुधार और गुणवत्ता नियंत्रण के क्षेत्र में एक महत्वपूर्ण कदम का प्रतीक है।

QQ截图20240628091656.png

 CriticGPT की मुख्य विशेषताएँ

1. GPT-4 श्रृंखला पर आधारित: CriticGPT शक्तिशाली GPT-4 भाषा मॉडल के आधार पर विकसित किया गया है।

2. कोड समीक्षा पर ध्यान केंद्रित: मुख्य रूप से ChatGPT द्वारा उत्पन्न प्रोग्रामिंग कोड का विश्लेषण करने और संभावित त्रुटियों को इंगित करने के लिए उपयोग किया जाता है।

3. मानव-मशीन सहयोग: मानव प्रशिक्षकों के AI सहायक के रूप में, कोड समीक्षा की दक्षता और सटीकता को बढ़ाता है।

4. सुदृढ़न सीखना: मानव प्रतिक्रिया से सीखकर AI प्रणाली के "संरेखण" के स्तर को बढ़ाता है।

QQ截图20240628091930.png

विकास प्रक्रिया और परिणाम

शोधकर्ताओं ने CriticGPT विकसित करने के लिए नवोन्मेषी प्रशिक्षण विधियों का उपयोग किया:

1. डेटा सेट की तैयारी: जानबूझकर त्रुटियों वाले कोड नमूनों का उपयोग करके प्रशिक्षण।

2. मानव सहभागिता: मानव प्रशिक्षकों से ChatGPT द्वारा लिखित कोड में संशोधन करने, त्रुटियाँ जोड़ने और प्रतिक्रिया देने का अनुरोध किया गया।

3. नई तकनीक का अनुप्रयोग: "फोर्स्ड सैंपलिंग बीम सर्च" (FSBS) तकनीक को शामिल किया गया, जो विस्तृत टिप्पणियों और काल्पनिक समस्याओं के उत्पादन के बीच संतुलन बनाता है।

QQ截图20240628091944.png

प्रयोगात्मक परिणाम दर्शाते हैं:

- 63% स्वाभाविक रूप से उत्पन्न त्रुटि मामलों में, मानव CriticGPT की आलोचना को अधिक पसंद करते हैं।

- CriticGPT ने बेकार की "निगरानी" और झूठी रिपोर्ट/भ्रम की समस्याओं को कम किया।

- 24% पहले पूर्ण समझे जाने वाले मामलों में, CriticGPT ने सफलतापूर्वक त्रुटियों की पहचान की और उन्हें मान्यता दी।

संभावित अनुप्रयोग और सीमाएँ

हालांकि CriticGPT मुख्य रूप से कोड समीक्षा के लिए है, शोध से पता चलता है कि इसे गैर-कोड कार्यों में भी लागू किया जा सकता है। हालाँकि, इस मॉडल के कुछ सीमाएँ भी हैं:

1. मुख्य रूप से छोटे ChatGPT उत्तरों पर प्रशिक्षित किया गया है, जो अधिक जटिल कार्यों के लिए उपयुक्त नहीं हो सकता।

2. हालाँकि झूठी गतिविधियों को कम किया गया है, लेकिन इसे पूरी तरह से समाप्त नहीं किया जा सका।

3. कई भागों में फैली हुई त्रुटियों की पहचान में अभी भी सुधार की आवश्यकता है।

भविष्य की संभावनाएँ

OpenAI CriticGPT जैसे मॉडलों को अपने RLHF टैगिंग पाइपलाइन में एकीकृत करने की योजना बना रहा है, ताकि प्रशिक्षकों को AI सहायता प्रदान की जा सके। यह बड़े भाषा मॉडल (LLM) के आउटपुट के मूल्यांकन के उपकरण विकास में महत्वपूर्ण प्रगति का प्रतिनिधित्व करता है। हालाँकि, शोधकर्ताओं ने यह भी रेखांकित किया कि AI सहायता के साथ भी, अत्यधिक जटिल कार्य मानव मूल्यांकनकर्ताओं के लिए अभी भी चुनौतीपूर्ण हैं।

जैसे-जैसे AI तकनीक में निरंतर प्रगति हो रही है, CriticGPT जैसे नवोन्मेष AI प्रणालियों की सटीकता और विश्वसनीयता को बढ़ाने में महत्वपूर्ण भूमिका निभाएंगे, और AI को मानव आवश्यकताओं के साथ और अधिक संरेखित करने में मदद करेंगे।

पता: https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/