3 मार्च, 2025 को, टोंगयी लिंगमा ने अपने नवीनतम अनुमान मॉडल Qwen2.5-Max को लॉन्च करने की घोषणा की, जो डेवलपर्स को शक्तिशाली प्रोग्रामिंग और गणितीय क्षमताएँ प्रदान करता है। Qwen2.5-Max ने 20 ट्रिलियन से अधिक टोकन के पूर्व-प्रशिक्षण डेटा का उपयोग किया है, और सावधानीपूर्वक डिज़ाइन किए गए प्रशिक्षण के बाद के समाधान के साथ, यह उत्कृष्ट प्रदर्शन दिखाता है।
कई बेंचमार्क परीक्षणों में, Qwen2.5-Max ने उत्कृष्ट प्रदर्शन किया है। उदाहरण के लिए, Arena-Hard, LiveBench, LiveCodeBench और GPQA-Diamond जैसे परीक्षणों में, Qwen2.5-Max का स्कोर DeepSeek V3, GPT-4o और Claude-3.5-Sonnet जैसे अन्य अग्रणी मॉडलों से आगे है। इसके अलावा, MMLU-Pro जैसे मूल्यांकन में, Qwen2.5-Max ने भी अत्यधिक प्रतिस्पर्धी स्कोर दिखाया है।
बेस मॉडल की तुलना में, Qwen2.5-Max की DeepSeek V3, Llama-3.1-405B और Qwen2.5-72B जैसे मॉडलों के साथ व्यापक तुलना की गई है। परिणाम दर्शाते हैं कि टोंगयी कियानवेन का बेस मॉडल अधिकांश बेंचमार्क परीक्षणों में उल्लेखनीय लाभ दिखाता है।
यह ध्यान देने योग्य है कि थर्ड-पार्टी बेंचमार्क परीक्षण प्लेटफॉर्म चैटबॉट एरिना द्वारा जारी नवीनतम बड़े मॉडल ब्लाइंड टेस्ट रैंकिंग में, Qwen2.5-Max ने DeepSeek-V3, Open AI o1-mini और Claude-3.5-Sonnet जैसे मॉडलों को पीछे छोड़ते हुए, 1332 अंकों के साथ वैश्विक स्तर पर सातवां स्थान प्राप्त किया है, जो चीन का सबसे अच्छा गैर-अनुमान प्रकार का बड़ा मॉडल है। गणित और प्रोग्रामिंग जैसी एकल क्षमताओं में, Qwen2.5-Max पहले स्थान पर है, और कठिन संकेतों (हार्ड प्रॉम्प्ट्स) की क्षमता में दूसरा स्थान पर है। चैटबॉट एरिना के अधिकारियों ने कहा कि अलीबाबा का Qwen2.5-Max कई क्षेत्रों में मजबूत प्रदर्शन करता है, खासकर प्रोग्रामिंग, गणित और कठिन संकेतों जैसे पेशेवर तकनीकी क्षेत्रों में।
वर्तमान में, Qwen2.5-Max को टोंगयी लिंगमा में एकीकृत किया गया है, और उपयोगकर्ता अपनी शक्तिशाली प्रोग्रामिंग क्षमताओं का अनुभव करने के लिए टोंगयी लिंगमा प्लगइन डाउनलोड कर सकते हैं।