通义千问团队最近 ने अपने नवीनतम Qwen2.5-Coder पूर्ण श्रृंखला को ओपन-सोर्स करने की घोषणा की है, जिसका उद्देश्य Open Code LLMs के विकास को बढ़ावा देना है। Qwen2.5-Coder अपनी शक्तिशाली, विविधता और उपयोगिता के लिए चर्चा में है। Qwen2.5-Coder-32B-Instruct मॉडल ने कोडिंग क्षमताओं में SOTA स्तर पर पहुंचकर GPT-4o के समान प्रदर्शन किया है, जिसमें कोड जनरेशन, कोड सुधार और कोड अनुमान जैसी व्यापक क्षमताएं शामिल हैं। इसने कई कोड जनरेशन बेंचमार्क परीक्षणों में सर्वश्रेष्ठ प्रदर्शन किया है और Aider बेंचमार्क परीक्षण में 73.7 अंक प्राप्त किए हैं, जो GPT-4o के प्रदर्शन के समान है।

微信截图_20241112083641.png

Qwen2.5-Coder 40 से अधिक प्रोग्रामिंग भाषाओं का समर्थन करता है और McEval पर 65.9 अंक प्राप्त किया है, जिसमें Haskell, Racket जैसी भाषाओं का प्रदर्शन विशेष रूप से उल्लेखनीय है। यह इसके पूर्व-प्रशिक्षण चरण के अद्वितीय डेटा सफाई और अनुपात का परिणाम है। इसके अलावा, Qwen2.5-Coder-32B-Instruct ने कई प्रोग्रामिंग भाषाओं में कोड सुधार क्षमताओं में भी उत्कृष्टता दिखाई है, MdEval बेंचमार्क परीक्षण में 75.2 अंक प्राप्त कर पहले स्थान पर रहा।

Qwen2.5-Coder-32B-Instruct की मानव प्राथमिकताओं के साथ संरेखण प्रदर्शन की जांच के लिए, एक आंतरिक रूप से लेबल किया गया कोड प्राथमिकता मूल्यांकन बेंचमार्क Code Arena बनाया गया। परिणामों ने दिखाया कि Qwen2.5-Coder-32B-Instruct प्राथमिकता संरेखण में एक लाभ प्रदान करता है।

Qwen2.5-Coder श्रृंखला ने इस बार चार आकार के मॉडल ओपन-सोर्स किए हैं, जिसमें 0.5B/3B/14B/32B शामिल हैं, जो मुख्यधारा के छह मॉडल आकारों को कवर करते हैं, विभिन्न डेवलपर्स की आवश्यकताओं को पूरा करते हैं। आधिकारिक तौर पर Base और Instruct दो प्रकार के मॉडल प्रदान किए गए हैं, जिसमें पहला डेवलपर्स के लिए मॉडल को ट्यून करने का आधार है, और दूसरा आधिकारिक संरेखित चैट मॉडल है। मॉडल के आकार और प्रदर्शन के बीच सकारात्मक संबंध है, Qwen2.5-Coder ने सभी आकारों में SOTA प्रदर्शन प्राप्त किया है।

Qwen2.5-Coder के 0.5B/1.5B/7B/14B/32B मॉडल Apache2.0 लाइसेंस के तहत उपलब्ध हैं, जबकि 3B मॉडल केवल अनुसंधान के लिए लाइसेंस प्राप्त है। टीम ने सभी डेटा सेट पर विभिन्न आकारों के Qwen2.5-Coder के प्रदर्शन का मूल्यांकन करके Code LLMs पर Scaling की प्रभावशीलता की पुष्टि की है।

Qwen2.5-Coder का ओपन-सोर्स डेवलपर्स को एक शक्तिशाली, विविधता और उपयोगिता से भरा प्रोग्रामिंग मॉडल विकल्प प्रदान करता है, जो प्रोग्रामिंग भाषा मॉडल के विकास और अनुप्रयोग को बढ़ावा देने में मदद करता है।

Qwen2.5-Coder मॉडल लिंक:

https://modelscope.cn/collections/Qwen25-Coder-9d375446e8f5814a