प्रकार :
- समाचार जानकारी
- उत्पाद अनुप्रयोग
- मुद्रीकरण मामले
- AI ट्यूटोरियल
2024-12-10 15:51:59.AIbase.13.8k
AI2 ने ओपन-सोर्स Tülu3 मॉडल लॉन्च किया, प्रदर्शन GPT-4o mini के समान
आर्टिफिशियल इंटेलिजेंस के क्षेत्र में, पोस्ट-ट्रेनिंग तकनीक धीरे-धीरे मॉडल प्रदर्शन बढ़ाने के लिए एक महत्वपूर्ण तरीका बनती जा रही है। हाल ही में, एलेन आर्टिफिशियल इंटेलिजेंस रिसर्च इंस्टीट्यूट (AI2) ने Tülu3 श्रृंखला मॉडल जारी किया है, जो पूरी तरह से ओपन-सोर्स उन्नत भाषा मॉडल का सेट है, जिसका प्रदर्शन GPT-4o-mini जैसे बंद-सोर्स मॉडलों के बराबर है। Tülu3 केवल मॉडल डेटा, कोड और प्रशिक्षण नुस्खे नहीं बल्कि मूल्यांकन ढांचा भी प्रदान करता है, जिसका उद्देश्य ओपन-सोर्स मॉडल पोस्ट-ट्रेनिंग तकनीक के विकास को बढ़ावा देना है। पारंपरिक रूप से, केवल पूर्व-प्रशिक्षित मॉडल अक्सर वास्तविक अनुप्रयोग की आवश्यकताओं को प्रभावी ढंग से पूरा नहीं कर पाते हैं, संभवतः।

2024-11-22 10:08:51.AIbase.13.4k
AI2 का ओपन-सोर्स प्रशिक्षण कार्यक्रम Tülu 3, बड़े मॉडलों के बाद प्रशिक्षण तकनीकी एकाधिकार को तोड़ना
ओपन-सोर्स AI के क्षेत्र में, बड़ी तकनीकी कंपनियों के साथ फासला सिर्फ कंप्यूटिंग शक्ति में नहीं है। AI2 (पूर्व में एलेन आर्टिफिशियल इंटेलिजेंस रिसर्च इंस्टीट्यूट) कई अग्रणी पहलों के माध्यम से इस खाई को पाटने के लिए काम कर रहा है, जिसका नवीनतम जारी किया गया Tülu3 बाद प्रशिक्षण कार्यक्रम यह सुनिश्चित करता है कि मूल बड़े भाषा मॉडल को उपयोगी AI सिस्टम में परिवर्तित करना सुलभ हो जाए। आम धारणा के विपरीत, बुनियादी भाषा मॉडल को प्री-ट्रेनिंग के बाद सीधे उपयोग में नहीं लाया जा सकता। वास्तव में, बाद प्रशिक्षण प्रक्रिया वह निर्णायक चरण है जो मॉडल के अंतिम मूल्य को परिभाषित करता है। ठीक इसी चरण में, मॉडल एक सर्वज्ञ लेकिन मूल्यांकन की कमी वाले रूप में विकसित होता है।
