InternViT-300M-448px-V2_5

InternViT-300M-448px का उन्नत संस्करण, जो दृश्य विशेषता निष्कर्षण क्षमता को बढ़ाता है।

सामान्य उत्पादछविदृश्य विशेषता निष्कर्षणबहु-मोडल अधिगम
InternViT-300M-448px-V2_5 InternViT-300M-448px का एक उन्नत संस्करण है, जो ViT वृद्धिशील अधिगम और NTP हानि (चरण 1.5) को अपनाकर दृश्य एन्कोडर की दृश्य विशेषताएँ निकालने की क्षमता को बढ़ाता है, खासकर बड़े पैमाने पर नेटवर्क डेटासेट में अपर्याप्त प्रतिनिधित्व वाले क्षेत्रों में, जैसे बहुभाषी OCR डेटा और गणितीय चार्ट। यह मॉडल InternViT 2.5 श्रृंखला का एक भाग है, जो पूर्ववर्ती के समान 'ViT-MLP-LLM' मॉडल आर्किटेक्चर को बनाए रखता है, और नए वृद्धिशील पूर्व-प्रशिक्षित InternViT को विभिन्न पूर्व-प्रशिक्षित LLM जैसे InternLM 2.5 और Qwen 2.5 के साथ एकीकृत करता है, जो यादृच्छिक रूप से इनिशियलाइज़्ड MLP प्रोजेक्टर का उपयोग करता है।
वेबसाइट खोलें

InternViT-300M-448px-V2_5 नवीनतम ट्रैफ़िक स्थिति

मासिक कुल विज़िट

29742941

बाउंस दर

44.20%

प्रति विज़िट औसत पृष्ठ

5.9

औसत विज़िट अवधि

00:04:44

InternViT-300M-448px-V2_5 विज़िट प्रवृत्ति

InternViT-300M-448px-V2_5 विज़िट भौगोलिक वितरण

InternViT-300M-448px-V2_5 ट्रैफ़िक स्रोत

InternViT-300M-448px-V2_5 विकल्प