निरंतर सुधार और उन्नयन के साथ, बड़े मॉडल越来越 स्मार्ट होते जा रहे हैं, लेकिन उन्हें वास्तव में हमारी आवश्यकताओं को समझने के लिए, निर्देश ट्यूनिंग महत्वपूर्ण है। Tencent यूटू प्रयोगशाला और शंघाई जियाओटोंग विश्वविद्यालय के विशेषज्ञों ने मिलकर एक गहन समीक्षा प्रकाशित की है जो निर्देश ट्यूनिंग डेटा सेट के मूल्यांकन और चयन की खोज करती है, जिससे हमें बड़े मॉडल के प्रदर्शन को बढ़ाने के रहस्य का पता चलता है।

image.png

बड़े मॉडल का लक्ष्य प्राकृतिक भाषा प्रसंस्करण की गहराई को समझना है, और निर्देश ट्यूनिंग उनके सीखने की प्रक्रिया का एक महत्वपूर्ण कदम है। विशेषज्ञों ने यह विश्लेषण किया है कि डेटा सेट का मूल्यांकन और चयन कैसे किया जाए, ताकि बड़े मॉडल विभिन्न कार्यों में उत्कृष्ट प्रदर्शन कर सकें।

यह समीक्षा न केवल आश्चर्यजनक रूप से विस्तृत है, बल्कि इसमें 400 से अधिक संबंधित साहित्य को शामिल किया गया है, जो डेटा की गुणवत्ता, विविधता और महत्व के तीन आयामों से हमें एक विस्तृत मार्गदर्शिका प्रदान करता है।

डेटा की गुणवत्ता सीधे निर्देश ट्यूनिंग के प्रभाव को प्रभावित करती है। विशेषज्ञों ने कई मूल्यांकन विधियों का सुझाव दिया है, जिसमें मैन्युअल डिज़ाइन किए गए मापदंड, मॉडल-आधारित मापदंड, GPT स्वचालित स्कोरिंग, और अनिवार्य मानव मूल्यांकन शामिल हैं।

विविधता का मूल्यांकन डेटा सेट की समृद्धि पर ध्यान केंद्रित करता है, जिसमें शब्दावली, अर्थ और समग्र डेटा वितरण की विविधता शामिल है। विविध डेटा सेट के माध्यम से, मॉडल विभिन्न परिदृश्यों में बेहतर ढंग से सामान्यीकृत कर सकता है।

महत्व का मूल्यांकन उन नमूनों का चयन करता है जो मॉडल प्रशिक्षण के लिए सबसे महत्वपूर्ण होते हैं। इससे न केवल प्रशिक्षण की दक्षता बढ़ती है, बल्कि यह सुनिश्चित करता है कि मॉडल जटिल कार्यों का सामना करते समय स्थिरता और सटीकता बनाए रखे।

हालांकि वर्तमान शोध ने कुछ परिणाम प्राप्त किए हैं, विशेषज्ञों ने चुनौतियों की भी पहचान की है, जैसे डेटा चयन और मॉडल प्रदर्शन के बीच संबंध की कमी और निर्देश की गुणवत्ता का मूल्यांकन करने के लिए एकीकृत मानकों की कमी।

भविष्य की ओर देखते हुए, विशेषज्ञों ने निर्देश ट्यूनिंग मॉडल का मूल्यांकन करने के लिए एक विशेष मानक स्थापित करने और विभिन्न डाउनस्ट्रीम कार्यों के लिए चयन पाइपलाइन की व्याख्यात्मकता को बढ़ाने की अपील की है।

Tencent यूटू प्रयोगशाला और शंघाई जियाओटोंग विश्वविद्यालय का यह शोध हमें एक मूल्यवान संसाधन प्रदान करता है और बड़े मॉडल के विकास के लिए दिशा प्रदान करता है। तकनीक के निरंतर प्रगति के साथ, हमें विश्वास है कि बड़े मॉडल और अधिक स्मार्ट होंगे और मानवता की बेहतर सेवा करेंगे।

पत्र का पता: https://arxiv.org/pdf/2408.02085