in
AI उत्पाद रैंकिंग
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
होम
AI समाचार
AI दैनिक
मुद्रीकरण गाइड
AI ट्यूटोरियल
AI उपकरण नेविगेशन
AI उत्पाद लाइब्रेरी
in
AI उत्पाद रैंकिंग
वैश्विक AI उत्पाद गतिशीलता खोजें
वैश्विक AI जानकारी खोजें, AI में नए अवसर खोजें
समाचार जानकारी
उत्पाद अनुप्रयोग
मुद्रीकरण मामले
AI ट्यूटोरियल
प्रकार :
समाचार जानकारी
उत्पाद अनुप्रयोग
मुद्रीकरण मामले
AI ट्यूटोरियल
2024-10-15 10:28:31
.
AIbase
.
12.4k
OCR 2.0 मॉडल आया! चार्ट, भौगोलिक आकृतियाँ, संगीत प्रतीकों को संपादनीय पाठ में परिवर्तित किया जा सकता है
हाल ही में, शोधकर्ताओं ने एक नए सामान्य ऑप्टिकल कैरेक्टर रिकॉग्निशन (OCR) मॉडल को विकसित किया है, जिसे GOT (सामान्य OCR सिद्धांत) कहा जाता है। अपने शोध पत्र में, उन्होंने पहली बार 'OCR2.0' की संकल्पना प्रस्तुत की, जो इस नए मॉडल का उद्देश्य पारंपरिक OCR सिस्टम के फायदों और बड़े भाषा मॉडल की शक्तिशाली क्षमताओं को एक साथ लाना है। GOT की संरचना काफी उन्नत है, जिसमें लगभग 8000 मिलियन पैरामीटर का एक चित्र एन्कोडर और 500 मिलियन पैरामीटर का एक डिकोडर शामिल है। चित्र एन्कोडर 1024x1024 पिक्सेल के चित्रों को संभाल सकता है।
2024-09-18 10:04:59
.
AIbase
.
11.8k
सामान्य पाठ पहचान अब आउट है! GOT-OCR2.0 फार्मूले और संगीत पत्तियों को भी समझता है
हाल ही में, GOT-OCR2.0 नामक एक एंड-टू-एंड OCR मॉडल उद्योग में व्यापक ध्यान आकर्षित कर रहा है। यह मॉडल केवल सामान्य पाठ पहचान कार्यों को संभालने में सक्षम नहीं है, बल्कि गणितीय सूत्रों, तालिकाओं, संगीत पत्तियों जैसी जटिलताओं का भी सामना कर सकता है, इसे OCR क्षेत्र का सर्वगुण संपन्न खिलाड़ी कहा जा सकता है। GOT-OCR2.0 का मुख्य लाभ इसके विविध कार्यों और उत्कृष्ट प्रदर्शन में निहित है। सबसे पहले, यह मॉडल मुख्य रूप से चीनी और अंग्रेजी वर्ण मान्यता का समर्थन करता है, और आगे की ट्यूनिंग के माध्यम से अधिक भाषाओं तक विस्तार किया जा सकता है। यह भाषाई उपयुक्तता GOT-OCR2.0 को अंतर्राष्ट्रीय उपयोग में उत्कृष्ट बनाती है।