हाल ही में, शंघाई जियाओटोंग विश्वविद्यालय और हार्वर्ड विश्वविद्यालय की शोध टीम ने एक नई मॉडल फाइन-ट्यूनिंग विधि - LoRA-Dash प्रस्तुत की है। यह नई विधि दावा करती है कि यह मौजूदा LoRA विधियों की तुलना में अधिक कुशल है, विशेष रूप से विशिष्ट कार्यों के फाइन-ट्यूनिंग में, यह 8 से 16 गुना कम पैरामीटर में भी समान परिणाम प्राप्त कर सकती है। यह निश्चित रूप से उन फाइन-ट्यूनिंग कार्यों के लिए एक महत्वपूर्ण突破 है जो बड़ी गणना संसाधनों की आवश्यकता होती है।

image.png

विशाल भाषा मॉडल के तेजी से विकास के संदर्भ में, विशिष्ट कार्यों के फाइन-ट्यूनिंग की आवश्यकता बढ़ती जा रही है। हालांकि, फाइन-ट्यूनिंग अक्सर बड़ी मात्रा में गणना संसाधनों का उपभोग करती है। इस समस्या को हल करने के लिए, शोध टीम ने पैरामीटर-कुशल फाइन-ट्यूनिंग (PEFT) रणनीति पेश की, जिसमें LoRA एक प्रमुख उदाहरण है। प्रयोगों से पता चला है कि LoRA मुख्य रूप से पूर्व-प्रशिक्षण में सीखे गए कुछ विशेषताओं को पकड़कर और बढ़ाकर फाइन-ट्यूनिंग का प्रभाव प्राप्त करती है।

हालांकि, LoRA की मूल शोध पत्र में "विशिष्ट कार्य दिशा" (TSD) की परिभाषा में कुछ अस्पष्टता थी। शोध टीम ने इस पर गहन विश्लेषण किया, और पहली बार TSD की सख्त परिभाषा दी, और इसकी प्रकृति को स्पष्ट किया। TSD का अर्थ है कि फाइन-ट्यूनिंग प्रक्रिया के दौरान, मॉडल पैरामीटर में महत्वपूर्ण परिवर्तन की मुख्य दिशा।

image.png

TSD के व्यावहारिक अनुप्रयोग में संभावनाओं को मुक्त करने के लिए, शोधकर्ताओं ने LoRA-Dash का प्रस्ताव रखा, जो दो प्रमुख चरणों में विभाजित है। पहला चरण "पूर्व-प्रारंभ चरण" है, जिसमें कार्य विशिष्ट दिशा की पहचान करनी होती है; दूसरा चरण "स्प्रिंट चरण" है, जिसमें पूर्व में पहचानी गई दिशा का उपयोग करके अनुकूलन समायोजन किया जाता है, ताकि मॉडल विशिष्ट कार्य के लिए बेहतर अनुकूल हो सके।

प्रयोगों से पता चलता है कि LoRA-Dash कई कार्यों में LoRA के प्रदर्शन को पार करता है, जैसे कि सामान्य ज्ञान तर्क, प्राकृतिक भाषा समझ और विषय-प्रेरित उत्पादन जैसे कार्यों में महत्वपूर्ण प्रदर्शन में सुधार। यह परिणाम TSD की प्रभावशीलता को डाउनस्ट्रीम कार्यों में दिखाता है, और कुशल फाइन-ट्यूनिंग की संभावनाओं को पूरी तरह से मुक्त करता है।

वर्तमान में, संबंधित शोध पत्र सार्वजनिक कर दिए गए हैं, और कोड भी ओपन-सोर्स किया गया है, शोध टीम आशा करती है कि अधिक शोधकर्ताओं और डेवलपर्स को समर्थन प्रदान किया जा सके, ताकि वे फाइन-ट्यूनिंग मॉडल के दौरान अधिक कुशलता से काम कर सकें।

परियोजना का प्रवेश द्वार: https://chongjiesi.site/project/2024-lora-dash.html

** मुख्य बिंदु:**

🌟 **LoRA-Dash विधि का लॉन्च:** नई मॉडल फाइन-ट्यूनिंग विधि LoRA-Dash पेश की गई है, जो LoRA की तुलना में अधिक कुशल है, और गणना की आवश्यकता में काफी कमी आई है।

⚡ **विशिष्ट कार्य दिशा को स्पष्ट करना:** शोध टीम ने "विशिष्ट कार्य दिशा" (TSD) की सख्त परिभाषा दी, और फाइन-ट्यूनिंग प्रक्रिया में इसकी महत्वपूर्णता को स्पष्ट किया।

🚀 **महत्वपूर्ण प्रयोग परिणाम:** प्रयोग दिखाते हैं कि LoRA-Dash सामान्य ज्ञान तर्क, प्राकृतिक भाषा समझ आदि कार्यों में LoRA से बेहतर प्रदर्शन करता है, जो कुशल फाइन-ट्यूनिंग की विशाल संभावनाओं को दर्शाता है।