Qwen टीम ने हाल ही में अपने नवीनतम विकसित मल्टी-मॉडल इनफेरेंस मॉडल QVQ को ओपन-सोर्स करने की घोषणा की है, जो दृष्टि समझ और जटिल समस्या समाधान क्षमता में कृत्रिम बुद्धिमत्ता के लिए एक महत्वपूर्ण कदम है। यह मॉडल Qwen2-VL-72B पर आधारित है, जिसका उद्देश्य भाषा और दृश्य जानकारी को मिलाकर एआई की इनफेरेंस क्षमता को बढ़ाना है। MMMU परीक्षण में, QVQ ने 70.3 का उच्च स्कोर प्राप्त किया, और कई गणित से संबंधित मानक परीक्षणों में Qwen2-VL-72B-Instruct की तुलना में उल्लेखनीय प्रदर्शन में सुधार दिखाया।
QVQ मॉडल ने दृश्य इनफेरेंस कार्यों में विशेष रूप से लाभप्रदता दिखाई है, विशेष रूप से उन क्षेत्रों में जहां जटिल विश्लेषणात्मक सोच की आवश्यकता होती है। हालांकि QVQ-72B-प्रिव्यू ने उत्कृष्ट प्रदर्शन किया है, टीम ने कुछ सीमाओं का भी उल्लेख किया है, जिसमें भाषा मिश्रण और कोड स्विचिंग समस्याएं, संभावित रूप से चक्रीय तर्क पैटर्न में फंसना, सुरक्षा और नैतिक विचार और प्रदर्शन और मानक सीमाएं शामिल हैं। टीम ने जोर दिया कि हालांकि मॉडल दृश्य इनफेरेंस में सुधार दिखाता है, यह Qwen2-VL-72B की क्षमताओं का पूरी तरह से प्रतिस्थापन नहीं कर सकता, और बहु-चरण दृश्य इनफेरेंस प्रक्रिया में, मॉडल धीरे-धीरे छवि सामग्री पर ध्यान केंद्रित करने में असमर्थ हो सकता है, जिससे भ्रांतियाँ हो सकती हैं।
Qwen टीम ने QVQ-72B-प्रिव्यू का चार डेटा सेट्स पर मूल्यांकन किया, जिसमें MMMU, MathVista, MathVision और OlympiadBench शामिल हैं, ये डेटा सेट मॉडल की दृश्य-संबंधित समग्र समझ और इनफेरेंस क्षमताओं का परीक्षण करने के लिए बनाए गए हैं। QVQ-72B-प्रिव्यू ने इन मानक परीक्षणों में उत्कृष्ट प्रदर्शन किया है और प्रमुख मॉडलों के बीच के अंतर को प्रभावी ढंग से कम किया है।
QVQ मॉडल के दृश्य इनफेरेंस कार्यों में अनुप्रयोगों को और प्रदर्शित करने के लिए, Qwen टीम ने कुछ उदाहरण प्रदान किए हैं और तकनीकी ब्लॉग के लिंक साझा किए हैं। इसके अलावा, टीम ने मॉडल इनफेरेंस के कोड उदाहरण भी प्रदान किए हैं, और कैसे 魔搭 API-Inference का उपयोग करके सीधे QVQ-72B-प्रिव्यू मॉडल को कॉल किया जाए, इसके तरीके साझा किए हैं। 魔搭 प्लेटफ़ॉर्म का API-Inference QVQ-72B-प्रिव्यू मॉडल का समर्थन करता है, उपयोगकर्ता API कॉल के माध्यम से सीधे इस मॉडल का उपयोग कर सकते हैं।
मॉडल लिंक:
https://modelscope.cn/models/Qwen/QVQ-72B-Preview
अनुभव लिंक:
https://modelscope.cn/studios/Qwen/QVQ-72B-preview
चाइनीज़ ब्लॉग:
https://qwenlm.github.io/zh/blog/qvq-72b-preview