InternVL 2.5
खुला स्रोत बहुविधा विशाल भाषा मॉडल श्रृंखला
सामान्य उत्पादउत्पादकताबहुविधाविशाल भाषा मॉडल
InternVL 2.5 InternVL 2.0 पर आधारित एक उन्नत बहुविधा विशाल भाषा मॉडल श्रृंखला है। यह मूल मॉडल आर्किटेक्चर को बनाए रखते हुए प्रशिक्षण और परीक्षण रणनीतियों और डेटा गुणवत्ता में उल्लेखनीय सुधार लाता है। इस मॉडल में मॉडल स्केलिंग और प्रदर्शन के बीच संबंध का गहन अध्ययन किया गया है, जिसमें दृश्य एन्कोडर, भाषा मॉडल, डेटासेट आकार और परीक्षण समय कॉन्फ़िगरेशन के प्रदर्शन रुझानों की व्यवस्थित रूप से खोज की गई है। व्यापक बेंचमार्किंग परीक्षणों में, जिसमें बहु-विषयक तर्क, दस्तावेज़ समझ, बहु-छवि/वीडियो समझ, वास्तविक दुनिया की समझ, बहुविधा भ्रम पहचान, दृश्य स्थानीयकरण, बहुभाषी क्षमता और शुद्ध भाषा प्रसंस्करण शामिल हैं, InternVL 2.5 ने GPT-4o और Claude-3.5-Sonnet जैसे प्रमुख वाणिज्यिक मॉडलों के साथ प्रतिस्पर्धी प्रदर्शन दिखाया है। विशेष रूप से, यह मॉडल MMMU बेंचमार्क में 70% से अधिक स्कोर करने वाला पहला ओपन-सोर्स MLLM है, जिसमें चेन-ऑफ़-थॉट (CoT) तर्क से 3.7 प्रतिशत का सुधार हुआ है, और परीक्षण समय स्केलिंग की मजबूत क्षमता का प्रदर्शन करता है।
InternVL 2.5 नवीनतम ट्रैफ़िक स्थिति
मासिक कुल विज़िट
29742941
बाउंस दर
44.20%
प्रति विज़िट औसत पृष्ठ
5.9
औसत विज़िट अवधि
00:04:44