ओपन-सोर्स एआई क्षेत्र में, बड़े तकनीकी कंपनियों के साथ अंतर केवल कंप्यूटिंग शक्ति में नहीं है। AI2 (पूर्व एलेन आर्टिफिशियल इंटेलिजेंस रिसर्च इंस्टीट्यूट) एक श्रृंखला के अभिनव पहलों के माध्यम से इस खाई को पाटने का प्रयास कर रहा है, जिसका नवीनतम लॉन्च Tülu3 बाद प्रशिक्षण योजना है, जो "कच्चे" बड़े भाषा मॉडल को व्यावहारिक एआई सिस्टम में बदलना सुलभ बनाता है।

सामान्य धारणा के विपरीत, आधारभूत भाषा मॉडल पूर्व-प्रशिक्षण के बाद सीधे उपयोग में नहीं लाए जा सकते। वास्तव में, बाद प्रशिक्षण प्रक्रिया ही मॉडल के अंतिम मूल्य का निर्धारण करने वाला महत्वपूर्ण चरण है। इसी चरण में, मॉडल एक "सर्वज्ञ" लेकिन निर्णय लेने में असमर्थ नेटवर्क से, विशिष्ट कार्यों के लिए उपयुक्त व्यावहारिक उपकरण में परिवर्तित होता है।

image.png

कई वर्षों तक, प्रमुख कंपनियों ने बाद प्रशिक्षण योजनाओं के बारे में चुप्पी साधी है। जबकि कोई भी नवीनतम तकनीक का उपयोग करके मॉडल बना सकता है, विशेष क्षेत्रों (जैसे मानसिक परामर्श या अनुसंधान विश्लेषण) में मॉडल को प्रभावी बनाने के लिए अद्वितीय बाद प्रशिक्षण तकनीक की आवश्यकता होती है। यहां तक कि मेटा के Llama जैसे "ओपन-सोर्स" परियोजनाओं के लिए, उनके मूल मॉडल के स्रोत और सामान्य प्रशिक्षण विधियाँ अभी भी कड़े रहस्य में हैं।

Tülu3 की उपस्थिति ने इस स्थिति को बदल दिया है। यह संपूर्ण बाद प्रशिक्षण योजना विषय चयन से लेकर डेटा प्रबंधन, सुदृढीकरण सीखने से लेकर सूक्ष्म समायोजन तक सभी पहलुओं को कवर करती है। उपयोगकर्ता अपनी आवश्यकताओं के अनुसार मॉडल की क्षमताओं को समायोजित कर सकते हैं, जैसे गणित और प्रोग्रामिंग क्षमताओं को बढ़ाना, या बहुभाषी प्रसंस्करण की प्राथमिकता को कम करना।

AI2 के परीक्षण से पता चला है कि Tülu3 द्वारा प्रशिक्षित मॉडल का प्रदर्शन शीर्ष ओपन-सोर्स मॉडल स्तर तक पहुँच गया है। यह突破 महत्वपूर्ण है: यह कंपनियों को एक पूरी तरह से स्वायत्त और नियंत्रित विकल्प प्रदान करता है। विशेष रूप से संवेदनशील डेटा से निपटने वाले संस्थानों के लिए, जैसे चिकित्सा अनुसंधान, अब तीसरे पक्ष के एपीआई या कस्टम सेवाओं पर निर्भर रहने की आवश्यकता नहीं है, वे स्थानीय रूप से पूरी प्रक्रिया का प्रशिक्षण कर सकते हैं, जिससे लागत में बचत होती है और गोपनीयता की सुरक्षा होती है।

AI2 ने न केवल इस योजना को लॉन्च किया, बल्कि इसे अपने उत्पादों में भी पहले लागू किया। हालाँकि वर्तमान परीक्षण परिणाम Llama मॉडल पर आधारित हैं, लेकिन वे अपने OLMo पर आधारित और Tülu3 द्वारा प्रशिक्षित एक नए मॉडल को लॉन्च करने की योजना बना रहे हैं, जो पूरी तरह से ओपन-सोर्स समाधान होगा।

यह तकनीकी ओपन-सोर्स न केवल AI2 की एआई लोकतंत्रीकरण को बढ़ावा देने की दृढ़ता को दर्शाता है, बल्कि पूरे ओपन-सोर्स एआई समुदाय में एक नई ऊर्जा का संचार करता है। यह हमें वास्तव में खुले, पारदर्शी एआई पारिस्थितिकी तंत्र के और करीब ले जाता है।