AI उत्पाद रैंकिंग

AI उत्पाद रैंकिंग

वैश्विक AI उत्पाद गतिशीलता खोजें

वैश्विक AI जानकारी खोजें, AI में नए अवसर खोजें

समाचार जानकारी
उत्पाद अनुप्रयोग
मुद्रीकरण मामले
AI ट्यूटोरियल

प्रकार :

समाचार जानकारी
उत्पाद अनुप्रयोग
मुद्रीकरण मामले
AI ट्यूटोरियल

2024-10-21 11:11:12.AIbase

अलीबाबा का दस्तावेज़ प्रसंस्करण मॉडल mPLUG-DocOwl1.5: बिना OCR के चार्ट, वेब और विभिन्न दस्तावेज़ों का विश्लेषण करने में सक्षम

हाल ही में, अलीबाबा के AI अनुसंधान दल ने दस्तावेज़ समझने के क्षेत्र में महत्वपूर्ण प्रगति की है, उन्होंने mPLUG-DocOwl1.5 जारी किया है, जो बिना OCR (ऑप्टिकल कैरेक्टर रिकग्निशन) दस्तावेज़ समझ कार्यों में उत्कृष्ट प्रदर्शन करने वाला एक अत्याधुनिक मॉडल है। पहले, जब हम दस्तावेज़ समझ कार्यों को संभालते थे, तो हम आमतौर पर छवियों से पाठ निकालने के लिए OCR तकनीक पर निर्भर करते थे, लेकिन यह अक्सर जटिल लेआउट और दृश्य शोर से प्रभावित होता था। जबकि mPLUG-DocOwl1.5 एक नई एकीकृत संरचना सीखने के ढांचे के माध्यम से,

अलीबाबा का दस्तावेज़ प्रसंस्करण मॉडल mPLUG-DocOwl1.5: बिना OCR के चार्ट, वेब और विभिन्न दस्तावेज़ों का विश्लेषण करने में सक्षम

2024-10-21 11:00:25.AIbase

टेबल्स और चार्ट्स को पूरी तरह से संभालें! अलीबाबा दामो अनुसंधान院 ने OCR की आवश्यकता के बिना डॉकओव्ल 1.5 ओपनसोर्स किया, कार्यकुशलता से दस्तावेज़ों को “समझें”!

अलीबाबा दामो अनुसंधान院 और चीन की पीपल्स यूनिवर्सिटी ने हाल ही में एक दस्तावेज़ प्रसंस्करण मॉडल, जिसे mPLUG-DocOwl1.5 कहा जाता है, का संयुक्त रूप से ओपनसोर्स किया है। यह मॉडल बिना OCR पहचान के दस्तावेज़ की सामग्री को समझने पर केंद्रित है और कई दृश्य दस्तावेज़ समझ बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन हासिल किया है। संरचनात्मक जानकारी समृद्ध पाठ छवियों (जैसे दस्तावेज़, टेबल और चार्ट) की अर्थव्यवस्था को समझने के लिए महत्वपूर्ण है। मौजूदा मल्टी-मॉडल बड़े भाषा मॉडल (MLLM) पाठ पहचान की क्षमता रखते हैं, लेकिन समृद्ध पाठ दस्तावेज़ छवियों की सामान्य संरचनात्मक समझ में कमी है।

टेबल्स और चार्ट्स को पूरी तरह से संभालें! अलीबाबा दामो अनुसंधान院 ने OCR की आवश्यकता के बिना डॉकओव्ल 1.5 ओपनसोर्स किया, कार्यकुशलता से दस्तावेज़ों को “समझें”!