Liquid AI ने हाल ही में अंतर्राष्ट्रीय शिक्षण प्रतिनिधित्व सम्मेलन (ICLR) 2025 से पहले अपने नए मॉडल "Hyena Edge" को जारी किया है। यह एक कन्वोल्यूशनल मल्टी-हाइब्रिड मॉडल है, जिसका उद्देश्य स्मार्टफोन और अन्य एज डिवाइसों के लिए अधिक कुशल आर्टिफिशियल इंटेलिजेंस समाधान प्रदान करना है। यह कंपनी बोस्टन में स्थापित हुई है और मैसाचुसेट्स इंस्टिट्यूट ऑफ टेक्नोलॉजी (MIT) से निकली है, जिसका उद्देश्य वर्तमान में अधिकांश बड़े भाषा मॉडल (LLM) पर निर्भर ट्रांसफॉर्मर आर्किटेक्चर से आगे निकलना है।

QQ_1745721153040.png

Hyena Edge ने कम्प्यूटेशनल दक्षता और भाषा मॉडल की गुणवत्ता दोनों में बेहतरीन प्रदर्शन किया है। वास्तविक डेटा के अनुसार, सैमसंग गैलेक्सी S24 अल्ट्रा फोन पर, Hyena Edge में देरी कम है, मेमोरी का उपयोग कम है, और समान पैरामीटर वाले ट्रांसफॉर्मर++ मॉडल की तुलना में विभिन्न बेंचमार्क परीक्षणों में बेहतर प्रदर्शन करता है। इस नए आर्किटेक्चर के डिजाइन से एज आर्टिफिशियल इंटेलिजेंस तकनीक के एक नए युग की शुरुआत होती है।

मोबाइल परिनियोजन के लिए डिज़ाइन किए गए अधिकांश छोटे मॉडल के विपरीत, Hyena Edge पारंपरिक भारी ध्यान केंद्रित डिजाइन को छोड़ देता है और इसके बजाय Hyena-Y श्रृंखला के गेटेड कन्वोल्यूशन का उपयोग करता है, जो दो-तिहाई समूहीकृत क्वेरी ध्यान (GQA) संचालन को प्रतिस्थापित करता है। Hyena Edge का आर्किटेक्चर Liquid AI के "कस्टम आर्किटेक्चर सिंथेसिस" (STAR) फ्रेमवर्क से लिया गया है, जो विकासवादी एल्गोरिदम के माध्यम से मॉडल संरचना को स्वचालित रूप से डिज़ाइन करता है ताकि देरी, मेमोरी उपयोग और मॉडल गुणवत्ता जैसे कई हार्डवेयर-विशिष्ट लक्ष्यों का अनुकूलन किया जा सके।

Hyena Edge की वास्तविक अनुप्रयोग क्षमता का परीक्षण करने के लिए, Liquid AI ने सैमसंग गैलेक्सी S24 अल्ट्रा पर परीक्षण किया, जिससे पता चला कि यह मॉडल लंबी अनुक्रम लंबाई पर प्रीफ़िलिंग और डिकोडिंग देरी की गति ट्रांसफॉर्मर++ की तुलना में 30% तेज है। साथ ही, सभी परीक्षण अनुक्रम लंबाई पर, Hyena Edge का मेमोरी उपयोग पारंपरिक मॉडल से कम है, जो इसे संसाधन-सीमित वातावरण में एक आदर्श विकल्प बनाता है।

QQ_1745721067890.png

बेंचमार्क परीक्षणों में, Hyena Edge को 100 बिलियन टोकन पर प्रशिक्षित किया गया था और इसमें विकिटेक्स्ट, लैम्बडा, PiQA, हेललास्वैग, विनोग्रांडे, ARC-ईज़ी और ARC-चैलेंज सहित कई मानक छोटे भाषा मॉडल परीक्षणों में उत्कृष्ट प्रदर्शन किया गया था, विशेष रूप से विकिटेक्स्ट और लैम्बडा में भ्रम स्कोर में उल्लेखनीय सुधार हुआ है, और PiQA, हेललास्वैग और विनोग्रांडे में सटीकता में भी सुधार हुआ है।

Liquid AI ने आने वाले महीनों में Hyena Edge सहित कई Liquid बेस मॉडल को ओपन सोर्स करने की भी योजना बनाई है, जिसका उद्देश्य एक कुशल सामान्य-उद्देश्यीय AI सिस्टम बनाना है जो क्लाउड डेटा सेंटर से व्यक्तिगत एज डिवाइस तक विस्तारित हो सके। Hyena Edge की सफलता न केवल इसके उत्कृष्ट प्रदर्शन संकेतकों में है, बल्कि यह स्वचालित आर्किटेक्चर डिज़ाइन की क्षमता को भी दर्शाता है, जो भविष्य के एज-ऑप्टिमाइज़्ड AI के लिए एक नया मानक स्थापित करता है।

आधिकारिक ब्लॉग:https://www.liquid.ai/research/convolutional-multi-hybrids-for-edge-devices

मुख्य बातें:  

🌟 Hyena Edge Liquid AI द्वारा जारी किया गया एक नया कन्वोल्यूशनल मॉडल है, जिसे स्मार्टफोन जैसे एज डिवाइसों के लिए डिज़ाइन किया गया है।  

🚀 यह मॉडल पारंपरिक ट्रांसफॉर्मर++ मॉडल की तुलना में कम्प्यूटेशनल दक्षता और मेमोरी उपयोग में बेहतर है, जो इसे संसाधन-सीमित वातावरण के लिए उपयुक्त बनाता है।  

📈 Hyena Edge ने कई मानक भाषा मॉडल बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन किया है, और तकनीक के प्रसार को बढ़ावा देने के लिए इसे भविष्य में ओपन सोर्स करने की योजना है।