Qwen-VL

सामान्य दृश्य भाषा मॉडल

सामान्य उत्पादउत्पादकतादृश्यभाषा मॉडल
Qwen-VL अलीबाबा क्लाउड द्वारा प्रस्तुत एक सामान्य दृश्य भाषा मॉडल है, जिसमें शक्तिशाली दृश्य समझ और बहु-मोडल तर्क क्षमता है। यह शून्य-शॉट छवि विवरण, दृश्य प्रश्नोत्तर, पाठ समझ, छवि लैंडमार्क लोकेशन जैसे कार्यों का समर्थन करता है, और कई दृश्य बेंचमार्क परीक्षणों में वर्तमान सर्वोत्तम स्तर तक पहुँचता है या उससे अधिक हो जाता है। यह मॉडल ट्रांसफॉर्मर संरचना को अपनाता है, 7B पैरामीटर स्केल पर पूर्व-प्रशिक्षित है, 448x448 रिज़ॉल्यूशन का समर्थन करता है, और छवि और पाठ के बहु-मोडल इनपुट और आउटपुट को एंड-टू-एंड संसाधित कर सकता है। Qwen-VL के लाभों में उच्च सामान्यता, बहुभाषाई समर्थन और सूक्ष्म समझ शामिल हैं। इसका व्यापक रूप से छवि समझ, दृश्य प्रश्नोत्तर, छवि एनोटेशन और छवि-पाठ पीढ़ी जैसे कार्यों में उपयोग किया जा सकता है।
वेबसाइट खोलें

Qwen-VL नवीनतम ट्रैफ़िक स्थिति

मासिक कुल विज़िट

474564576

बाउंस दर

36.20%

प्रति विज़िट औसत पृष्ठ

6.1

औसत विज़िट अवधि

00:06:34

Qwen-VL विज़िट प्रवृत्ति

Qwen-VL विज़िट भौगोलिक वितरण

Qwen-VL ट्रैफ़िक स्रोत

Qwen-VL विकल्प