Arcee AI ने आज SuperNova लॉन्च किया है, जो एक 700 अरब पैरामीटर वाला भाषा मॉडल है, जो व्यवसायों को तैनाती, उन्नत निर्देश पालन क्षमता और पूरी तरह से अनुकूलन विकल्प प्रदान करता है। यह मॉडल व्यवसाय डेटा गोपनीयता, मॉडल स्थिरता और अनुकूलन के लिए एक मजबूत, स्वामित्व वाला विकल्प प्रदान करने के लिए डिज़ाइन किया गया है, ताकि API-आधारित सेवाओं (जैसे OpenAI और Anthropic) से संबंधित महत्वपूर्ण मुद्दों का समाधान किया जा सके।

image.png

क्लाउड API द्वारा संचालित AI क्षेत्र में, Arcee AI ने SuperNova के माध्यम से एक अलग दृष्टिकोण अपनाया है। यह बड़ा भाषा मॉडल (LLM) व्यवसाय की अपनी आधारभूत संरचना के भीतर तैनात और अनुकूलित किया जा सकता है। SuperNova आज जारी किया गया है, जो Meta के Llama-3.1-70B-Instruct आर्किटेक्चर पर आधारित है और Arcee द्वारा दावा की गई उन्नत निर्देश पालन क्षमता और विशिष्ट व्यावसायिक आवश्यकताओं के लिए एक नए प्रकार की प्रशिक्षण प्रक्रिया का उपयोग करता है।

तकनीकी नवाचार

SuperNova का विकास कई पहलुओं के प्रशिक्षण विधियों को शामिल करता है।

परियोजना के प्रमुख इंजीनियर लुकास एटकिंस ने रहस्य का खुलासा किया: "हमने तीन मॉडलों को प्रशिक्षित किया, एक Llama405B से निकाले गए सार के साथ, एक हमारे EvolKit द्वारा उत्पन्न डेटा सेट के साथ, और एक Llama3instruct पर गहन DPO के संशोधन के साथ। अंत में, हमने एक नए जादू से उन्हें एकीकृत किया, प्रत्येक मॉडल की सुपर क्षमताओं को बनाए रखते हुए।"

Arcee का दावा है कि इसने SuperNova की निर्देश पालन क्षमता को तैयार किया है, विशेष रूप से 405B पैरामीटर मॉडल के डिस्टिलेशन से, जो न केवल SuperNova को मध्यम हार्डवेयर तैनाती के दौरान बनाए रखने में मदद करता है, बल्कि बड़े मॉडल की आत्मा को भी पकड़ता है।

व्यवसाय तैनाती और अनुकूलन

SuperNova को व्यवसाय के अपने क्लाउड वातावरण में तैनात करने के लिए डिज़ाइन किया गया है, जो पहले AWS मार्केटप्लेस पर उपलब्ध है। Arcee इसे Google और Azure मार्केटप्लेस पर उपलब्ध कराने के लिए भी प्रयासरत है।

Arcee AI के सह-संस्थापक मार्क मैकक्वेड ने इस तैनाती विधि के लाभों पर जोर दिया: "मॉडल आपके AWS VPC में तैनात है, लेकिन यह एक वेब सर्वर, एक चैट इंटरफेस और आपके चैट इतिहास को संग्रहीत करने के लिए एक डेटाबेस भी शुरू करेगा। संगठन के हर व्यक्ति के साथ यह निकटता से इंटरैक्ट कर सकता है।"

यह तैनाती विधि व्यवसायों के डेटा गोपनीयता और मॉडल स्थिरता के बारे में चिंताओं का समाधान करती है। उन API-आधारित सेवाओं के विपरीत जो बिना सूचना के बदल सकती हैं, SuperNova व्यवसायों को पूर्ण नियंत्रण प्रदान करती है। मैकक्वेड ने बताया कि हाल के AI उद्योग के उतार-चढ़ाव को देखते हुए यह विशेष रूप से महत्वपूर्ण है: "OpenAI ने अभी 3.5 को छोड़ दिया है... कई कंपनियों ने 3.5 के API के चारों ओर अपने व्यवसाय स्थापित किए हैं। इसलिए जब वह API बदलता है, तो आपका एप्लिकेशन क्रैश हो जाता है। लेकिन हमारे दुनिया में, जब तक आप बदलना नहीं चाहते, तब तक कुछ भी नहीं बदलेगा, क्योंकि यह आपका मॉडल है, इसे चलाने का आपका तरीका है।"

अनुकूलन और निरंतर सुधार

SuperNova का एक बड़ा लाभ यह है कि इसे व्यवसाय के वातावरण में सूक्ष्म समायोजन और पुनः प्रशिक्षण किया जा सकता है।

एटकिंस ने इस प्रक्रिया और इसके लाभों को समझाया: "समय के साथ, हम पूरी तरह से आपके अपने वातावरण में मॉडल को फिर से प्रशिक्षित कर सकते हैं, ताकि यह आपकी प्राथमिकताओं के अनुसार बेहतर हो सके। जैसे-जैसे हम इन चैट को सहेजते हैं, यदि आप चाहते हैं कि मॉडल आपके व्यवसाय की अद्वितीय प्राथमिकताओं के अनुसार व्यापक रूप से सुधार हो, तो हम ऐसा करने की क्षमता रखते हैं, बिना आपके सिस्टम से डेटा निकाले।"

यह क्षमता तकनीकी टीमों को मॉडल को विशिष्ट क्षेत्र की जानकारी या कंपनी की विशिष्ट आवश्यकताओं के अनुसार अनुकूलित करने की अनुमति देती है। यह उन क्लाउड-आधारित API सेवाओं की तुलना में निश्चित रूप से एक बड़ा लाभ है जो इस स्तर के अनुकूलन की अनुमति नहीं देती हैं।

ओपन-सोर्स घटक

हालांकि पूरा 70B मॉडल ओपन-सोर्स नहीं है, Arcee डेवलपर समुदाय के लिए कई घटक जारी कर रहा है:

परीक्षण और मूल्यांकन के लिए मुफ्त API: यह डेवलपर्स को बिना पूर्ण तैनाती के SuperNova का प्रयास करने की अनुमति देता है।

SuperNova-Lite: एक 8B पैरामीटर का ओपन-सोर्स संस्करण मॉडल। यह छोटा मॉडल संसाधन सीमित वातावरण में काम करने वाले डेवलपर्स या पूर्ण मॉडल को तैनात करने से पहले आर्किटेक्चर को समझने के इच्छुक डेवलपर्स के लिए उपयोगी हो सकता है।

EvolKit: उनका डेटा सेट निर्माण पाइपलाइन, जटिल QA जोड़ों के निर्माण के लिए। यह उपकरण उन संगठनों के लिए मूल्यवान हो सकता है जो अपने विशिष्ट उपयोग के मामलों के लिए कस्टम प्रशिक्षण डेटा बनाना चाहते हैं।

इन घटकों को ओपन-सोर्स करके, Arcee ने व्यापक AI समुदाय में योगदान दिया है, जबकि संभावित ग्राहकों को अपने उत्पादों का मूल्यांकन और अनुकूलन करने के उपकरण भी प्रदान किए हैं। Arcee SuperNova भी AWS मार्केटप्लेस पर उपलब्ध है।

प्रदर्शन बयान और बेंचमार्किंग

Arcee का दावा है कि SuperNova सभी क्षेत्रों में अच्छा प्रदर्शन करता है, विशेष रूप से गणितीय तर्क में। "एटकिंस ने उल्लेख किया: "यह गणितीय बेंचमार्किंग में बहुत अच्छा है।" हालांकि, कंपनी अपने दावों की पुष्टि के लिए तीसरे पक्ष के मूल्यांकन को प्रोत्साहित करती है।

"हम लोगों के उपयोग के लिए एक API प्रदान करेंगे। यदि कोई तीसरा पक्ष विश्वसनीय बेंचमार्किंग चलाना चाहता है, तो हम उनके लिए वजन तक पहुंच प्रदान करने की व्यवस्था कर सकते हैं। हम इस मॉडल के लिए पूर्ण पारदर्शिता चाहते हैं," एटकिंस ने कहा।

तीसरे पक्ष के मूल्यांकन के प्रति यह खुलापन सराहनीय है, क्योंकि यह Arcee के दावों की स्वतंत्र पुष्टि की अनुमति देता है। यह देखना विशेष रूप से दिलचस्प होगा कि SuperNova मानक बेंचमार्किंग में OpenAI, Anthropic जैसे प्रमुख AI कंपनियों के मॉडलों की तुलना में कैसा प्रदर्शन करता है।

image.png

image.png

व्यवसाय AI रणनीति पर प्रभाव

SuperNova का लॉन्च कई व्यवसायों द्वारा अपनी AI रणनीति का पुनर्मूल्यांकन करने के समय पर हो रहा है। जबकि क्लाउड-आधारित API सेवाएं इस क्षेत्र में प्रमुखता बनाए हुए हैं, तैनाती योग्य, अनुकूलन योग्य मॉडलों में बढ़ती रुचि है, जो अधिक नियंत्रण और लचीलापन प्रदान करते हैं।

SuperNova का दृष्टिकोण कई महत्वपूर्ण मुद्दों का समाधान करता है:

  • डेटा गोपनीयता: कंपनी की अपनी आधारभूत संरचना में तैनात करके, SuperNova सुनिश्चित करता है कि संवेदनशील डेटा कभी भी संगठन के नियंत्रण से बाहर न जाए।
  • मॉडल स्थिरता: API सेवाओं के विपरीत जो बिना सूचना के बदल या समाप्त हो सकती हैं, SuperNova एक स्थिर आधार प्रदान करता है, जो केवल तब बदलता है जब संगठन इसे अपडेट करने का चयन करता है।
  • अनुकूलन: कंपनी के विशिष्ट डेटा पर मॉडल को सूक्ष्म समायोजन और पुनः प्रशिक्षण करने की क्षमता, गहरे अनुकूलन की अनुमति देती है जो अधिकांश API सेवाओं द्वारा संभव नहीं है।
  • लागत नियंत्रण: जबकि प्रारंभिक तैनाती में बहुत सारे संसाधनों की आवश्यकता हो सकती है, SuperNova को चलाने की दीर्घकालिक लागत बड़े पैमाने पर API कॉल के लिए भुगतान की गई लागत से कम हो सकती है।
  • प्रतिस्पर्धात्मक लाभ: एक अनुकूलित, निरंतर सुधारित AI मॉडल AI-संचालित अंतर्दृष्टि में महत्वपूर्ण उद्योगों में महत्वपूर्ण प्रतिस्पर्धात्मक लाभ प्रदान कर सकता है।

AI संप्रभुता की दुविधा

जैसे-जैसे व्यवसाय तेजी से विकसित हो रहे AI क्षेत्र में नेविगेट करते हैं, SuperNova का लॉन्च उद्योग में बढ़ती तनाव को उजागर करता है: क्लाउड-आधारित AI सेवाओं की सुविधा और क्षमता और तैनाती योग्य मॉडलों द्वारा प्रदान की गई नियंत्रण और अनुकूलन के बीच का संतुलन। यह द्विभाजन हमें "AI संप्रभुता की दुविधा" कह सकते हैं।

एक ओर, GPT-4 और Claude जैसे क्लाउड-आधारित API सेवाएं अत्याधुनिक प्रदर्शन और निरंतर अपडेट प्रदान करती हैं, लेकिन इसके साथ डेटा गोपनीयता के मुद्दे और सीमित अनुकूलन की कीमत चुकानी पड़ती है। दूसरी ओर, SuperNova जैसे मॉडल पूर्ण नियंत्रण और अनुकूलन का वादा करते हैं, लेकिन इसके लिए तैनाती और रखरखाव के लिए आंतरिक विशेषज्ञता की आवश्यकता होती है।

Arcee ने SuperNova के माध्यम से जो दृष्टिकोण अपनाया है, वह इस अंतर को पाटने का प्रयास करता है, एक ऐसा मॉडल प्रदान करता है जिसे स्थानीय रूप से तैनात किया जा सकता है, जबकि फिर भी प्रमुख क्लाउड-आधारित सेवाओं के साथ प्रतिस्पर्धा करने के लिए डिज़ाइन की गई क्षमताएँ प्रदान करता है। यह मिश्रित दृष्टिकोण विशेष रूप से उन उद्योगों के लिए आकर्षक हो सकता है जिनमें सख्त नियामक आवश्यकताएँ हैं या जो अत्यधिक संवेदनशील डेटा का प्रबंधन करते हैं।

आधिकारिक ब्लॉग: https://blog.arcee.ai/meet-arcee-supernova-our-flagship-70b-model-alternative-to-openai/