अली क्लाउड ने नए अपग्रेडेड Qwen2.5-Turbo बड़े भाषा मॉडल को लॉन्च किया है, जिसकी संदर्भ लंबाई 1 मिलियन टोकन तक पहुंच गई है। यह किस तरह का मतलब है? यह 10 "थ्री-बॉडी" उपन्यासों, 150 घंटे की आवाज़ ट्रांसक्रिप्शन या 30,000 लाइनों के कोड की क्षमता के बराबर है! अब सच में "एक बार में दस उपन्यास पढ़ना" कोई सपना नहीं रहा!

Qwen2.5-Turbo मॉडल ने पासकी रिट्रीवल कार्य में 100% सटीकता हासिल की है, और लंबे पाठ को समझने की क्षमता में GPT-4 जैसे समान मॉडलों को पीछे छोड़ दिया है। इस मॉडल ने RULER लंबे पाठ मानक परीक्षण में 93.1 का उच्च स्कोर प्राप्त किया, जबकि GPT-4 का स्कोर केवल 91.6 था, और GLM4-9B-1M का स्कोर 89.9 था।

image.png

अत्यधिक लंबे पाठ को संभालने की क्षमता के अलावा, Qwen2.5-Turbo में छोटे पाठ को संभालने की सटीकता भी है, छोटे पाठ मानक परीक्षण में, इसका प्रदर्शन GPT-4o-mini और Qwen2.5-14B-Instruct मॉडल के बराबर है।

स्पार्स ध्यान तंत्र का उपयोग करके, Qwen2.5-Turbo मॉडल ने 1 मिलियन टोकन के पहले टोकन को संसाधित करने का समय 4.9 मिनट से घटाकर 68 सेकंड कर दिया, जिससे 4.3 गुना तेजी से अनुमानित गति में वृद्धि हुई।

साथ ही, 1 मिलियन टोकन को संसाधित करने की लागत केवल 0.3 चीनी युआन है, जो GPT-4o-mini की तुलना में समान लागत पर 3.6 गुना अधिक सामग्री को संसाधित कर सकता है।

image.png

अली क्लाउड ने Qwen2.5-Turbo मॉडल के लिए कई डेमो तैयार किए हैं, जो इसकी गहन समझ की क्षमताओं को प्रदर्शित करते हैं जैसे कि लंबे उपन्यासों, कोड सहायता और कई शोध पत्रों को पढ़ना। उदाहरण के लिए, जब उपयोगकर्ता ने 690,000 टोकन की "थ्री-बॉडी" त्रिलॉजी की चीनी उपन्यास अपलोड की, तो मॉडल ने प्रत्येक उपन्यास की कहानी को अंग्रेजी में सफलतापूर्वक संक्षेपित किया।

उपयोगकर्ता अली क्लाउड मॉडल स्टूडियो के API सेवाओं, HuggingFace डेमो या ModelScope डेमो के माध्यम से Qwen2.5-Turbo मॉडल की शक्तिशाली क्षमताओं का अनुभव कर सकते हैं।

अली क्लाउड ने कहा है कि भविष्य में वे मॉडल को अनुकूलित करते रहेंगे, लंबे अनुक्रम कार्यों में मानव प्राथमिकताओं के साथ संरेखण को बढ़ाएंगे, अनुमानित दक्षता को और अनुकूलित करेंगे, गणना के समय को कम करेंगे, और बड़े और शक्तिशाली लंबे संदर्भ मॉडल पेश करने का प्रयास करेंगे।

आधिकारिक जानकारी: https://qwenlm.github.io/blog/qwen2.5-turbo/

ऑनलाइन डेमो: https://huggingface.co/spaces/Qwen/Qwen2.5-Turbo-1M-Demo

API दस्तावेज़: https://help.aliyun.com/zh/model-studio/getting-started/first-api-call-to-qwen