हाल ही में, माइक्रोसॉफ्ट के शोधकर्ताओं ने एक नई AI ढांचे का प्रस्ताव रखा है जिसे Auto Evol-Instruct कहा जाता है, यह ढांचा स्वचालित रूप से मार्गदर्शक डेटा सेट को विकसित कर सकता है, बिना किसी मानव हस्तक्षेप की आवश्यकता के।

कृत्रिम बुद्धिमत्ता के क्षेत्र में, बड़े भाषा मॉडल (LLMs) का विकास अत्यंत महत्वपूर्ण है, विशेष रूप से इन मॉडलों की विस्तृत निर्देशों का पालन करने की क्षमता को बढ़ाने के मामले में। शोधकर्ता यह पता लगाने की कोशिश कर रहे हैं कि LLMs को प्रशिक्षित करने के लिए उपयोग किए जाने वाले डेटा सेट को कैसे सुधारा जाए, ताकि मॉडल के प्रदर्शन और अनुकूलता में सुधार हो सके।

image.png

पारंपरिक विकास विधियाँ जैसे Evol-Instruct मानव विशेषज्ञों द्वारा निर्धारित विकास नियमों पर निर्भर करती हैं, जो न केवल महंगी और समय लेने वाली होती हैं, बल्कि नए कार्यों के अनुकूल होने पर विधियों को फिर से डिज़ाइन करने की आवश्यकता होती है। इसके विपरीत, Auto Evol-Instruct पहले LLMs का उपयोग करके इनपुट निर्देशों का विश्लेषण करता है और स्वायत्त रूप से विकास नियमों की प्रारंभिक विधि का डिज़ाइन करता है, जिससे स्वचालित विकास प्रक्रिया को प्राप्त किया जाता है। इसके बाद, LLMs द्वारा अनुकूलक के माध्यम से विकास विधियों का पुनरावृत्त अनुकूलन किया जाता है, विकास प्रक्रिया में समस्याओं की पहचान और समाधान किया जाता है, यह सुनिश्चित करने के लिए कि अंतिम विकास निर्देशों की जटिलता और स्थिरता बनी रहे।

Auto Evol-Instruct इनपुट निर्देशों का स्वचालित विश्लेषण करके और विकास नियमों को निर्धारित करके, LLMs का उपयोग करके विकास विधियों को डिज़ाइन करता है, जिससे डेटा सेट की जटिलता और विविधता में वृद्धि होती है।

प्रदर्शन मूल्यांकन के मामले में, Auto Evol-Instruct ने कई मानक परीक्षणों में उत्कृष्ट प्रदर्शन किया है। उदाहरण के लिए, केवल 10K विकसित ShareGPT डेटा का उपयोग करके Mixtral-8x7B को ट्यून करने पर, ढांचे ने MT-Bench पर 8.09 अंक प्राप्त किए, AlpacaEval पर 91.4 अंक प्राप्त किए, GPT-3.5-Turbo और WizardLM-70B को पार करते हुए, और Claude2.0 के बराबर।

इसके अलावा, केवल 7K विकसित GSM8K प्रशिक्षण डेटा का उपयोग करके, ढांचे ने GSM8K पर 82.49 अंक प्राप्त किए, कोड निर्माण में, 20K विकसित Code Alpaca का उपयोग करके DeepSeek-Coder-Base-33B को ट्यून करने पर, ढांचे ने HumanEval पर 77.4 अंक प्राप्त किए, जो अन्य प्रतिस्पर्धी मॉडलों को पार करता है।

image.png

यह स्पष्ट है कि यह नया ढांचा कई मानक परीक्षणों में उत्कृष्ट प्रदर्शन करता है, जिसमें MT-Bench, AlpacaEval, GSM8K और HumanEval शामिल हैं, जो निर्देशों का पालन करने, गणितीय तर्क और कोड निर्माण की क्षमताओं को बढ़ाने की अपनी क्षमता को प्रदर्शित करता है।

पेपर का पता: https://arxiv.org/abs/2406.00770

मुख्य बिंदु:

🔍 Auto Evol-Instruct एक पूरी तरह से स्वचालित AI ढांचा है, जो स्वचालित रूप से मार्गदर्शक डेटा सेट का विश्लेषण और विकास कर सकता है, बिना मानव हस्तक्षेप के।

🚀 ढांचा विकास विधियों को अनुकूलित करके, डेटा सेट की जटिलता और विविधता को प्रभावी ढंग से बढ़ाता है, जिससे विभिन्न कार्यों में LLMs के प्रदर्शन और अनुकूलता में सुधार होता है।

💡 Auto Evol-Instruct के शोध परिणाम दर्शाते हैं कि डेटा सेट के मार्गदर्शन के विकास के लिए स्वचालन विधियों के माध्यम से।