in
AI उत्पाद रैंकिंग
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
होम
AI समाचार
AI दैनिक
मुद्रीकरण गाइड
AI ट्यूटोरियल
AI उपकरण नेविगेशन
AI उत्पाद लाइब्रेरी
in
AI उत्पाद रैंकिंग
वैश्विक AI उत्पाद गतिशीलता खोजें
वैश्विक AI जानकारी खोजें, AI में नए अवसर खोजें
समाचार जानकारी
उत्पाद अनुप्रयोग
मुद्रीकरण मामले
AI ट्यूटोरियल
प्रकार :
समाचार जानकारी
उत्पाद अनुप्रयोग
मुद्रीकरण मामले
AI ट्यूटोरियल
2024-10-21 11:11:12
.
AIbase
.
12.6k
अलीबाबा का दस्तावेज़ प्रसंस्करण मॉडल mPLUG-DocOwl1.5: बिना OCR के चार्ट, वेब और विभिन्न दस्तावेज़ों का विश्लेषण करने में सक्षम
हाल ही में, अलीबाबा के AI अनुसंधान दल ने दस्तावेज़ समझने के क्षेत्र में महत्वपूर्ण प्रगति की है, उन्होंने mPLUG-DocOwl1.5 जारी किया है, जो बिना OCR (ऑप्टिकल कैरेक्टर रिकग्निशन) दस्तावेज़ समझ कार्यों में उत्कृष्ट प्रदर्शन करने वाला एक अत्याधुनिक मॉडल है। पहले, जब हम दस्तावेज़ समझ कार्यों को संभालते थे, तो हम आमतौर पर छवियों से पाठ निकालने के लिए OCR तकनीक पर निर्भर करते थे, लेकिन यह अक्सर जटिल लेआउट और दृश्य शोर से प्रभावित होता था। जबकि mPLUG-DocOwl1.5 एक नई एकीकृत संरचना सीखने के ढांचे के माध्यम से,
2024-10-21 11:00:25
.
AIbase
.
12.6k
टेबल्स और चार्ट्स को पूरी तरह से संभालें! अलीबाबा दामो अनुसंधान院 ने OCR की आवश्यकता के बिना डॉकओव्ल 1.5 ओपनसोर्स किया, कार्यकुशलता से दस्तावेज़ों को “समझें”!
अलीबाबा दामो अनुसंधान院 और चीन की पीपल्स यूनिवर्सिटी ने हाल ही में एक दस्तावेज़ प्रसंस्करण मॉडल, जिसे mPLUG-DocOwl1.5 कहा जाता है, का संयुक्त रूप से ओपनसोर्स किया है। यह मॉडल बिना OCR पहचान के दस्तावेज़ की सामग्री को समझने पर केंद्रित है और कई दृश्य दस्तावेज़ समझ बेंचमार्क परीक्षणों में उत्कृष्ट प्रदर्शन हासिल किया है। संरचनात्मक जानकारी समृद्ध पाठ छवियों (जैसे दस्तावेज़, टेबल और चार्ट) की अर्थव्यवस्था को समझने के लिए महत्वपूर्ण है। मौजूदा मल्टी-मॉडल बड़े भाषा मॉडल (MLLM) पाठ पहचान की क्षमता रखते हैं, लेकिन समृद्ध पाठ दस्तावेज़ छवियों की सामान्य संरचनात्मक समझ में कमी है।