通义千问团队 ने घोषणा की है कि Qwen2 के रिलीज के तीन महीने बाद, Qwen परिवार के नवीनतम सदस्य - Qwen2.5 श्रृंखला भाषा मॉडल आधिकारिक रूप से ओपन-सोर्स कर दिया गया है। यह इतिहास में सबसे बड़े ओपन-सोर्स रिलीज़ में से एक का प्रतीक है, जिसमें सामान्य भाषा मॉडल Qwen2.5, और विशेष रूप से प्रोग्रामिंग और गणित के क्षेत्रों के लिए Qwen2.5-Coder और Qwen2.5-Math मॉडल शामिल हैं।

Qwen2.5 श्रृंखला मॉडल को नवीनतम बड़े पैमाने पर डेटा सेट पर पूर्व-प्रशिक्षित किया गया है, जिसमें 18T टोकन तक शामिल हैं। Qwen2 की तुलना में, नए मॉडल में ज्ञान अधिग्रहण, प्रोग्रामिंग क्षमताओं और गणितीय क्षमताओं में महत्वपूर्ण सुधार हुआ है। मॉडल लंबे पाठ को संसाधित करने का समर्थन करता है, और 8K टोकन तक की सामग्री उत्पन्न कर सकता है, और 29 से अधिक भाषाओं का समर्थन बनाए रखा है।

微信截图_20240919080229.png

微信截图_20240919080238.png

Qwen2.5 श्रृंखला मॉडल का ओपन-सोर्स न केवल Apache2.0 लाइसेंस का उपयोग करता है, बल्कि विभिन्न अनुप्रयोग आवश्यकताओं के लिए विभिन्न आकारों के संस्करण भी प्रदान करता है। इसके अतिरिक्त, 通义千问 टीम ने GPT-4 के समान प्रदर्शन वाले Qwen2-VL-72B मॉडल को भी ओपन-सोर्स किया है।

नया मॉडल निर्देश निष्पादन, लंबे पाठ उत्पन्न करने, संरचित डेटा को समझने और संरचित आउटपुट उत्पन्न करने में महत्वपूर्ण सुधार प्राप्त किया है। विशेष रूप से प्रोग्रामिंग और गणित के क्षेत्रों में, Qwen2.5-Coder और Qwen2.5-Math मॉडल को पेशेवर डेटा सेट पर प्रशिक्षित किया गया है, जो विशेष क्षेत्र की क्षमताओं को प्रदर्शित करते हैं।

Qwen2.5 श्रृंखला मॉडल अनुभव:

  • Qwen2.5 संग्रह: https://modelscope.cn/studios/qwen/Qwen2.5