通义千问团队 ने घोषणा की है कि Qwen2 के रिलीज के तीन महीने बाद, Qwen परिवार के नवीनतम सदस्य - Qwen2.5 श्रृंखला भाषा मॉडल आधिकारिक रूप से ओपन-सोर्स कर दिया गया है। यह इतिहास में सबसे बड़े ओपन-सोर्स रिलीज़ में से एक का प्रतीक है, जिसमें सामान्य भाषा मॉडल Qwen2.5, और विशेष रूप से प्रोग्रामिंग और गणित के क्षेत्रों के लिए Qwen2.5-Coder और Qwen2.5-Math मॉडल शामिल हैं।
Qwen2.5 श्रृंखला मॉडल को नवीनतम बड़े पैमाने पर डेटा सेट पर पूर्व-प्रशिक्षित किया गया है, जिसमें 18T टोकन तक शामिल हैं। Qwen2 की तुलना में, नए मॉडल में ज्ञान अधिग्रहण, प्रोग्रामिंग क्षमताओं और गणितीय क्षमताओं में महत्वपूर्ण सुधार हुआ है। मॉडल लंबे पाठ को संसाधित करने का समर्थन करता है, और 8K टोकन तक की सामग्री उत्पन्न कर सकता है, और 29 से अधिक भाषाओं का समर्थन बनाए रखा है।
Qwen2.5 श्रृंखला मॉडल का ओपन-सोर्स न केवल Apache2.0 लाइसेंस का उपयोग करता है, बल्कि विभिन्न अनुप्रयोग आवश्यकताओं के लिए विभिन्न आकारों के संस्करण भी प्रदान करता है। इसके अतिरिक्त, 通义千问 टीम ने GPT-4 के समान प्रदर्शन वाले Qwen2-VL-72B मॉडल को भी ओपन-सोर्स किया है।
नया मॉडल निर्देश निष्पादन, लंबे पाठ उत्पन्न करने, संरचित डेटा को समझने और संरचित आउटपुट उत्पन्न करने में महत्वपूर्ण सुधार प्राप्त किया है। विशेष रूप से प्रोग्रामिंग और गणित के क्षेत्रों में, Qwen2.5-Coder और Qwen2.5-Math मॉडल को पेशेवर डेटा सेट पर प्रशिक्षित किया गया है, जो विशेष क्षेत्र की क्षमताओं को प्रदर्शित करते हैं।
Qwen2.5 श्रृंखला मॉडल अनुभव:
Qwen2.5 संग्रह: https://modelscope.cn/studios/qwen/Qwen2.5