AI2 का ओपन-सोर्स प्रशिक्षण कार्यक्रम Tülu 3, बड़े मॉडलों के बाद प्रशिक्षण तकनीकी एकाधिकार को तोड़ना

ओपन-सोर्स एआई क्षेत्र में, बड़े तकनीकी कंपनियों के साथ अंतर केवल कंप्यूटिंग शक्ति में नहीं है। AI2 (पूर्व एलेन आर्टिफिशियल इंटेलिजेंस रिसर्च इंस्टीट्यूट) एक श्रृंखला के अभिनव पहलों के माध्यम से इस खाई को पाटने का प्रयास कर रहा है, जिसका नवीनतम लॉन्च Tülu3 बाद प्रशिक्षण योजना है, जो "कच्चे" बड़े भाषा मॉडल को व्यावहारिक एआई सिस्टम में बदलना सुलभ बनाता है।

सामान्य धारणा के विपरीत, आधारभूत भाषा मॉडल पूर्व-प्रशिक्षण के बाद सीधे उपयोग में नहीं लाए जा सकते। वास्तव में, बाद प्रशिक्षण प्रक्रिया ही मॉडल के अंतिम मूल्य का निर्धारण करने वाला महत्वपूर्ण चरण है। इसी चरण में, मॉडल एक "सर्वज्ञ" लेकिन निर्णय लेने में असमर्थ नेटवर्क से, विशिष्ट कार्यों के लिए उपयुक्त व्यावहारिक उपकरण में परिवर्तित होता है।

कई वर्षों तक, प्रमुख कंपनियों ने बाद प्रशिक्षण योजनाओं के बारे में चुप्पी साधी है। जबकि कोई भी नवीनतम तकनीक का उपयोग करके मॉडल बना सकता है, विशेष क्षेत्रों (जैसे मानसिक परामर्श या अनुसंधान विश्लेषण) में मॉडल को प्रभावी बनाने के लिए अद्वितीय बाद प्रशिक्षण तकनीक की आवश्यकता होती है। यहां तक कि मेटा के Llama जैसे "ओपन-सोर्स" परियोजनाओं के लिए, उनके मूल मॉडल के स्रोत और सामान्य प्रशिक्षण विधियाँ अभी भी कड़े रहस्य में हैं।

Tülu3 की उपस्थिति ने इस स्थिति को बदल दिया है। यह संपूर्ण बाद प्रशिक्षण योजना विषय चयन से लेकर डेटा प्रबंधन, सुदृढीकरण सीखने से लेकर सूक्ष्म समायोजन तक सभी पहलुओं को कवर करती है। उपयोगकर्ता अपनी आवश्यकताओं के अनुसार मॉडल की क्षमताओं को समायोजित कर सकते हैं, जैसे गणित और प्रोग्रामिंग क्षमताओं को बढ़ाना, या बहुभाषी प्रसंस्करण की प्राथमिकता को कम करना।

AI2 के परीक्षण से पता चला है कि Tülu3 द्वारा प्रशिक्षित मॉडल का प्रदर्शन शीर्ष ओपन-सोर्स मॉडल स्तर तक पहुँच गया है। यह突破 महत्वपूर्ण है: यह कंपनियों को एक पूरी तरह से स्वायत्त और नियंत्रित विकल्प प्रदान करता है। विशेष रूप से संवेदनशील डेटा से निपटने वाले संस्थानों के लिए, जैसे चिकित्सा अनुसंधान, अब तीसरे पक्ष के एपीआई या कस्टम सेवाओं पर निर्भर रहने की आवश्यकता नहीं है, वे स्थानीय रूप से पूरी प्रक्रिया का प्रशिक्षण कर सकते हैं, जिससे लागत में बचत होती है और गोपनीयता की सुरक्षा होती है।

AI2 ने न केवल इस योजना को लॉन्च किया, बल्कि इसे अपने उत्पादों में भी पहले लागू किया। हालाँकि वर्तमान परीक्षण परिणाम Llama मॉडल पर आधारित हैं, लेकिन वे अपने OLMo पर आधारित और Tülu3 द्वारा प्रशिक्षित एक नए मॉडल को लॉन्च करने की योजना बना रहे हैं, जो पूरी तरह से ओपन-सोर्स समाधान होगा।

यह तकनीकी ओपन-सोर्स न केवल AI2 की एआई लोकतंत्रीकरण को बढ़ावा देने की दृढ़ता को दर्शाता है, बल्कि पूरे ओपन-सोर्स एआई समुदाय में एक नई ऊर्जा का संचार करता है। यह हमें वास्तव में खुले, पारदर्शी एआई पारिस्थितिकी तंत्र के और करीब ले जाता है।

AI समाचार

AI2 का ओपन-सोर्स प्रशिक्षण कार्यक्रम Tülu 3, बड़े मॉडलों के बाद प्रशिक्षण तकनीकी एकाधिकार को तोड़ना

AIbase基地

संबंधित AI समाचार अनुशंसाएँ

AI21 Labs ने Jambaa 1.6 जारी किया, जो लंबे टेक्स्ट को संसाधित करने की सीमा को तोड़ता है और कई भाषाओं का समर्थन करता है

LTX-वीडियो 0.9.5 जारी: ओपन-सोर्स AI वीडियो निर्माण एक नई ऊंचाई पर

Mistral CEO की प्रशंसा DeepSeek: ओपन-सोर्स AI एक महत्वपूर्ण क्षण में प्रवेश कर रहा है

AI और Web3 का उपयोग करके निर्माण करना आपकी सोच से कहीं आसान