25 अगस्त को, अली क्लाउड ने बड़े पैमाने पर विज़ुअल लैंग्वेज मॉडल Qwen-VL लॉन्च किया, जो चीनी और अंग्रेजी सहित कई भाषाओं का समर्थन करता है और टेक्स्ट और इमेज की संयुक्त समझ क्षमता रखता है। Qwen-VL अली क्लाउड के पहले के ओपन-सोर्स जनरल लैंग्वेज मॉडल Qwen-7B पर आधारित है। अन्य विज़ुअल लैंग्वेज मॉडलों की तुलना में, Qwen-VL ने विज़ुअल लोकेशन, इमेज में टेक्स्ट की समझ जैसी नई क्षमताएँ जोड़ी हैं। Qwen-VL ने GitHub पर 3400 से अधिक स्टार प्राप्त किए हैं, और डाउनलोड संख्या 400,000 से अधिक है। विज़ुअल लैंग्वेज मॉडल को सामान्य AI के महत्वपूर्ण विकास दिशा के रूप में देखा जाता है। उद्योग का मानना है कि मल्टी-मोडल इनपुट का समर्थन करने वाले मॉडल दुनिया की समझने की क्षमता को बढ़ा सकते हैं और उपयोग के दृश्य को विस्तारित कर सकते हैं। अली क्लाउड Qwen-VL के ओपन-सोर्स के माध्यम से सामान्य AI प्रौद्योगिकी की प्रगति को आगे बढ़ा रहा है।
अली क्लाउड टोंग यी कियान वें फिर से ओपनस्रोत: मल्टी-मॉडल बड़ा मॉडल क्यूवेन-वीएल
