हाल ही में, मेटा एआई ने एक नया क्वांटाइज्ड लामा3.2 मॉडल लॉन्च किया है, जिसमें 1B और 3B संस्करण शामिल हैं। यह मॉडल विभिन्न उपकरणों पर फाइन-ट्यूनिंग, डिस्टिलेशन और डिप्लॉयमेंट के लिए सक्षम है।

image.png

पहले, जबकि लामा3 जैसे मॉडल ने प्राकृतिक भाषा समझने और उत्पन्न करने में महत्वपूर्ण उपलब्धियाँ हासिल की हैं, उनकी विशालता और उच्च कंप्यूटिंग आवश्यकताओं ने कई संगठनों के लिए उपयोग करना मुश्किल बना दिया है। लंबे प्रशिक्षण समय, उच्च ऊर्जा खपत और महंगे हार्डवेयर पर निर्भरता ने निश्चित रूप से तकनीकी दिग्गजों और छोटे व्यवसायों के बीच की खाई को बढ़ा दिया है।

लामा3.2 की एक विशेषता यह है कि यह बहु-भाषाई टेक्स्ट और इमेज प्रोसेसिंग का समर्थन करता है। 1B और 3B मॉडल के क्वांटाइजेशन के बाद, औसतन 56% आकार में कमी आई है, और मेमोरी उपयोग में 41% की कमी आई है, साथ ही 2-3 गुना गति में वृद्धि हुई है, जो मोबाइल उपकरणों और एज कंप्यूटिंग वातावरण में चलाने के लिए बहुत उपयुक्त है।

विशेष रूप से, ये मॉडल 8-बिट और 4-बिट क्वांटाइजेशन रणनीतियों का उपयोग करते हैं, जो मूल 32-बिट फ्लोटिंग-पॉइंट वेट्स और सक्रियता सटीकता को कम करते हैं, जिससे मेमोरी आवश्यकताओं और कंप्यूटिंग क्षमता की आवश्यकताओं में काफी कमी आती है। इसका मतलब है कि क्वांटाइज्ड लामा3.2 मॉडल सामान्य उपभोक्ता स्तर के GPU या यहां तक कि CPU पर चल सकता है, और प्रदर्शन में लगभग कोई हानि नहीं होती है।

कल्पना कीजिए, उपयोगकर्ता अब अपने मोबाइल पर विभिन्न स्मार्ट एप्लिकेशनों का उपयोग कर सकते हैं, जैसे कि चर्चा सामग्री का वास्तविक समय में सारांश तैयार करना या कैलेंडर टूल का उपयोग करना, जो इन हल्के मॉडल के कारण संभव हो पाया है।

image.png

मेटा एआई ने क्वालकॉम और मीडियाटेक जैसे उद्योग के अग्रणी भागीदारों के साथ मिलकर इन मॉडलों को आर्म सीपीयू-आधारित सिस्टम-ऑन-चिप पर तैनात किया है, यह सुनिश्चित करते हुए कि ये विभिन्न उपकरणों पर प्रभावी ढंग से उपयोग किए जा सकें। प्रारंभिक परीक्षणों से पता चला है कि क्वांटाइज्ड लामा3.2 ने प्रमुख प्राकृतिक भाषा प्रोसेसिंग बेंचमार्क परीक्षणों में लामा3 मॉडल के प्रदर्शन का 95% हासिल किया है, जबकि मेमोरी उपयोग में लगभग 60% की कमी आई है। यह उन कंपनियों और शोधकर्ताओं के लिए महत्वपूर्ण है जो बिना उच्च लागत वाली अवसंरचना में निवेश किए एआई का लाभ उठाना चाहते हैं।

मेटा एआई द्वारा लॉन्च किया गया क्वांटाइज्ड लामा3.2 मॉडल न केवल आर्टिफिशियल इंटेलिजेंस तकनीक की पहुंच को बढ़ाने में एक महत्वपूर्ण कदम है, बल्कि वर्तमान में बड़े पैमाने पर भाषा मॉडल अनुप्रयोगों में कुछ मुख्य समस्याओं को भी हल करता है, जैसे लागत और पर्यावरणीय प्रभाव। यह कुशल मॉडल विकास प्रवृत्ति भविष्य में एआई के सतत और समावेशी विकास को बढ़ावा देने में महत्वपूर्ण होगी।

मॉडल का प्रवेश: https://www.llama.com/

मुख्य बिंदु:

🌟 मेटा एआई द्वारा जारी क्वांटाइज्ड लामा3.2 मॉडल में 1B और 3B संस्करण शामिल हैं, जो मॉडल के आकार और कंप्यूटिंग संसाधनों की आवश्यकता को काफी कम करता है।

⚡️ मॉडल की अनुमानित गति 2-4 गुना बढ़ गई है, जो सामान्य उपभोक्ता हार्डवेयर के लिए उपयुक्त है, और वास्तविक समय के अनुप्रयोगों के लिए आदर्श है।

🌍 क्वांटाइज्ड लामा3.2 प्राकृतिक भाषा प्रोसेसिंग प्रदर्शन में लगभग मूल संस्करण के समान है, जो कंपनियों और शोधकर्ताओं को एआई अनुप्रयोगों को लागू करने में सहायता करता है।