शोध से पता चलता है कि बड़े प्री-ट्रेंड भाषा मॉडल (LLM), जैसे कि GPT-3, मानव द्वारा पूछे गए प्रश्नों को समझने और उत्तर देने, कोडिंग कार्यों में सहायता करने आदि में उत्कृष्ट क्षमता रखते हैं। हाल ही में, शोधकर्ताओं ने RAIN विधि को पेश किया, जिससे LLM को अतिरिक्त डेटा और माइक्रो-ट्यूनिंग के बिना आत्म-आकलन और सुधार करने में सक्षम बनाया गया। यह विधि न केवल LLM के प्रदर्शन में सुधार करती है, बल्कि शत्रुतापूर्ण हमलों की सफलता दर को भी कम करती है, जिससे AI अधिक समन्वित और सुरक्षित प्रतिक्रियाएँ उत्पन्न कर सकता है। यह शोध LLM को मानव प्राथमिकताओं के अनुरूप समायोजित करने के लिए एक नई विधि प्रदान करता है, बिना अतिरिक्त जानकारी या जटिल माइक्रो-ट्यूनिंग की आवश्यकता के।
बड़े पूर्व-प्रशिक्षित भाषा मॉडल RAIN विधि के माध्यम से आत्म-मूल्यांकन और सुरक्षा रक्षा में सक्षम
