शंघाई आर्टिफिशियल इंटेलिजेंस लैब ने घोषणा की है कि उसके शुशेन बड़े मॉडल ने महत्वपूर्ण संस्करण उन्नयन प्राप्त किया है, जिसने शुशेन・पु यु 3.0 (InternLM3) लॉन्च किया है। प्रयोगशाला के अनुसार, नए संस्करण ने डेटा उपयोग दक्षता में उल्लेखनीय सुधार किया है, जिससे विचार घनत्व में वृद्धि हुई है।
इस उन्नयन के InternLM3-8B-Instruct मॉडल ने केवल 4T डेटा का उपयोग करके प्रशिक्षण लिया है, और आधिकारिक तौर पर कहा गया है कि इसकी समग्र प्रदर्शन समान आकार के ओपन-सोर्स मॉडल से अधिक है, और प्रशिक्षण लागत में 75% से अधिक की बचत की गई है। यह ध्यान देने योग्य है कि यह संस्करण पहली बार सामान्य मॉडल में नियमित बातचीत और गहन सोच की क्षमताओं का एकीकरण करता है, जिससे यह विविध वास्तविक उपयोग परिदृश्यों का बेहतर सामना कर सकता है।
मॉडल के मूल्यांकन के संबंध में, अनुसंधान टीम ने सिना OpenCompass ओपन-सोर्स मूल्यांकन ढांचे के आधार पर, मूल्यांकन के लिए एक एकीकृत पुनरुत्पादक विधि का उपयोग किया। मूल्यांकन सामग्री में CMMLU, GPQA आदि के दस से अधिक प्राधिकृत मूल्यांकन सेट शामिल हैं, जो तर्क, गणित, प्रोग्रामिंग, निर्देश पालन, लंबी पाठ उत्पत्ति, बातचीत और समग्र प्रदर्शन जैसे कई आयामों को कवर करते हैं। मूल्यांकन परिणाम दर्शाते हैं कि शुशेन・पु यु 3.0 अधिकांश मूल्यांकन सेटों में उच्चतम स्कोर पर है, और इसका समग्र प्रदर्शन GPT-4o-mini के बहुत करीब है।
शंघाई एआई लैब ने यह भी कहा कि इस नए संस्करण का मॉडल ओपन-सोर्स समुदाय में पहला सामान्य बातचीत मॉडल बन गया है जो ब्राउज़र उपयोग का समर्थन करता है, जो 20 से अधिक वेब पृष्ठों के बीच कूदने का समर्थन करता है, जिससे गहन जानकारी की खोज की जा सकती है।
अनुभव पृष्ठ: https://internlm-chat.intern-ai.org.cn।
मुख्य बिंदु:
🌟 शुशेन・पु यु 3.0 मॉडल ने 4T डेटा प्रशिक्षण के माध्यम से, समान आकार के ओपन-सोर्स मॉडल से अधिक समग्र प्रदर्शन किया, और 75% से अधिक प्रशिक्षण लागत बचाई।
📊 मॉडल ने कई प्राधिकृत मूल्यांकन सेटों में उच्च स्कोर प्राप्त किया, और सोच एवं बातचीत की क्षमताओं का एकीकरण काफी बढ़ा है।
🌐 नया मॉडल ब्राउज़र उपयोग का समर्थन करता है, गहन जानकारी की खोज कर सकता है, और ओपन-सोर्स समुदाय के लिए एक प्रमुख आकर्षण बन गया है।