Qwen2-VL-2B
अत्याधुनिक दृश्य भाषा मॉडल, बहु-मोडल समझ और पाठ निर्माण का समर्थन करता है।
सामान्य उत्पादछविदृश्य भाषा मॉडलबहु-मोडल
Qwen2-VL-2B, Qwen-VL मॉडल का नवीनतम पुनरावृत्ति है, जो लगभग एक वर्ष के नवाचारों का प्रतिनिधित्व करता है। इस मॉडल ने MathVista, DocVQA, RealWorldQA, MTVQA आदि सहित दृश्य समझ बेंचमार्क परीक्षणों में अत्याधुनिक प्रदर्शन प्राप्त किया है। यह 20 मिनट से अधिक लंबे वीडियो को समझ सकता है, वीडियो-आधारित प्रश्नोत्तर, वार्तालाप, सामग्री निर्माण आदि के लिए उच्च-गुणवत्ता वाला समर्थन प्रदान करता है। Qwen2-VL बहुभाषी समर्थन भी प्रदान करता है, जिसमें अंग्रेजी और चीनी के अलावा, अधिकांश यूरोपीय भाषाएँ, जापानी, कोरियाई, अरबी, वियतनामी आदि शामिल हैं। मॉडल आर्किटेक्चर के अपडेट में नाइव डायनामिक रेजोल्यूशन और मल्टीमॉडल रोटरी पोजीशन एम्बेडिंग (M-ROPE) शामिल हैं, जिससे इसकी बहु-मोडल प्रसंस्करण क्षमता में वृद्धि हुई है।
Qwen2-VL-2B नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
29742941
बाउंस दर
44.20%
प्रति विज़िट औसत पृष्ठ
5.9
औसत विज़िट अवधि
00:04:44