यूएई सरकार द्वारा समर्थित तकनीकी नवाचार अनुसंधान संस्थान (TII) ने हाल ही में अपने नए ओपन-सोर्स छोटे भाषा मॉडल (SLM) - फाल्कन3 श्रृंखला की घोषणा की। इस श्रृंखला में चार अलग-अलग आकार के मॉडल शामिल हैं: 1B, 3B, 7B और 10B, और यह डेवलपर्स, शोधकर्ताओं और व्यवसायों को एक कुशल और लागत-कुशल AI समाधान प्रदान करने के लिए बुनियादी और निर्देशित संस्करणों के दो रूपों में उपलब्ध है। इन मॉडलों का लॉन्च AI क्षमताओं के और अधिक लोकतंत्रीकरण का प्रतीक है, जो हल्के एकल GPU बुनियादी ढांचे पर चलने में सक्षम है, सीमित कंप्यूटिंग संसाधनों वाले उपकरणों और अनुप्रयोगों की आवश्यकताओं को पूरा करता है।

QQ20241218-092217.png

चित्र स्रोत नोट: चित्र AI द्वारा उत्पन्न, चित्र लाइसेंस सेवा प्रदाता Midjourney द्वारा प्रदान किया गया

फाल्कन3 का प्रदर्शन Hugging Face रैंकिंग में उभरा है, जिसने समान आकार के ओपन-सोर्स मॉडलों जैसे कि मेटा के लामा और क्यूवेन-2.5 को पार किया है। विशेष रूप से 7B और 10B संस्करणों ने तर्क गति, भाषा समझ, निर्देश निष्पादन और कोड और गणित कार्यों जैसे क्षेत्रों में प्रमुख तकनीकी लाभ दिखाया है, और कई बेंचमार्क परीक्षणों में Google, मेटा और अलीबाबा जैसे प्रतिस्पर्धियों को भी पार किया है।

पारंपरिक बड़े भाषा मॉडल (LLM) की तुलना में, SLM मॉडल में कम पैरामीटर और अधिक सरल डिज़ाइन के कारण उच्चतम दक्षता और कम लागत का लाभ है, जो विशेष रूप से ग्राहक सेवा, स्वास्थ्य देखभाल, इंटरनेट ऑफ थिंग्स जैसे क्षेत्रों में उपयोग के लिए उपयुक्त है। बाजार अनुसंधान कंपनी Valuates Reports के अनुसार, SLM बाजार आने वाले पांच वर्षों में 18% की वार्षिक वृद्धि दर हासिल करने की उम्मीद है।

फाल्कन3 श्रृंखला के प्रशिक्षण डेटा का आकार 14 ट्रिलियन टोकन तक पहुँच गया है, जो इसके पूर्ववर्ती फाल्कन2 से दो गुना अधिक है। इस श्रृंखला ने केवल डिकोडर आर्किटेक्चर और समूह पूछताछ ध्यान तंत्र का उपयोग किया है, जिससे मेमोरी उपयोग को न्यूनतम किया गया है, जबकि तर्क दक्षता में सुधार किया गया है। फाल्कन3 अंग्रेजी, फ्रेंच, स्पेनिश और पुर्तगाली जैसी चार भाषाओं का समर्थन करता है और 32K के संदर्भ विंडो से लैस है, जो लंबे इनपुट पाठ को संभालने में सक्षम है, विभिन्न उद्योगों की आवश्यकताओं को पूरा करता है।

TII ने कहा कि फाल्कन3 का बुनियादी मॉडल सामान्य कार्यों के लिए उपयुक्त है, जबकि निर्देशित संस्करण विशेष रूप से ग्राहक सेवा और आभासी सहायक जैसे संवाद कार्यों के लिए अनुकूलित है। इस श्रृंखला का लॉन्च सीमांत कंप्यूटिंग और गोपनीयता संवेदनशील अनुप्रयोगों के विकास को और बढ़ावा देगा, जैसे व्यक्तिगत अनुशंसाएँ, डेटा विश्लेषण, चिकित्सा निदान और आपूर्ति श्रृंखला अनुकूलन।

सभी फाल्कन3 मॉडल TII फाल्कन लाइसेंस 2.0 के तहत जारी किए गए हैं, जो Apache 2.0 पर आधारित एक लचीला लाइसेंस है, जो जिम्मेदार AI विकास और तैनाती का समर्थन करता है। डेवलपर्स और शोधकर्ताओं को शुरुआत करने में मदद करने के लिए, TII ने फाल्कन प्लेग्राउंड परीक्षण वातावरण भी लॉन्च किया है, जहाँ उपयोगकर्ता इन मॉडलों को एकीकृत करने से पहले परीक्षण कर सकते हैं।