25 अगस्त को, अली क्लाउड ने बड़े पैमाने पर विज़ुअल लैंग्वेज मॉडल Qwen-VL लॉन्च किया, जो चीनी और अंग्रेजी सहित कई भाषाओं का समर्थन करता है और टेक्स्ट और इमेज की संयुक्त समझ क्षमता रखता है। Qwen-VL अली क्लाउड के पहले के ओपन-सोर्स जनरल लैंग्वेज मॉडल Qwen-7B पर आधारित है। अन्य विज़ुअल लैंग्वेज मॉडलों की तुलना में, Qwen-VL ने विज़ुअल लोकेशन, इमेज में टेक्स्ट की समझ जैसी नई क्षमताएँ जोड़ी हैं। Qwen-VL ने GitHub पर 3400 से अधिक स्टार प्राप्त किए हैं, और डाउनलोड संख्या 400,000 से अधिक है। विज़ुअल लैंग्वेज मॉडल को सामान्य AI के महत्वपूर्ण विकास दिशा के रूप में देखा जाता है। उद्योग का मानना है कि मल्टी-मोडल इनपुट का समर्थन करने वाले मॉडल दुनिया की समझने की क्षमता को बढ़ा सकते हैं और उपयोग के दृश्य को विस्तारित कर सकते हैं। अली क्लाउड Qwen-VL के ओपन-सोर्स के माध्यम से सामान्य AI प्रौद्योगिकी की प्रगति को आगे बढ़ा रहा है।
अली क्लाउड टोंग यी कियान वें फिर से ओपनस्रोत: मल्टी-मॉडल बड़ा मॉडल क्यूवेन-वीएल

亿邦动力
यह लेख AIbase दैनिक से है
【AI दैनिक】 कॉलम में आपका स्वागत है! यहाँ आर्टिफ़िशियल इंटेलिजेंस की दुनिया का पता लगाने के लिए आपकी दैनिक मार्गदर्शिका है। हर दिन हम आपके लिए AI क्षेत्र की हॉट कंटेंट पेश करते हैं, डेवलपर्स पर ध्यान केंद्रित करते हैं, तकनीकी रुझानों को समझने में आपकी मदद करते हैं और अभिनव AI उत्पाद अनुप्रयोगों को समझते हैं।