ViTLP

दस्तावेज़ बुद्धिमत्ता के दृश्यमान मार्गदर्शन द्वारा पाठ लेआउट पूर्व प्रशिक्षित मॉडल उत्पन्न करना

सामान्य उत्पादउत्पादकताOCRदस्तावेज़ बुद्धिमत्ता
ViTLP एक दृश्यमान मार्गदर्शन द्वारा उत्पन्न पाठ लेआउट पूर्व प्रशिक्षित मॉडल है जिसका उद्देश्य दस्तावेज़ बुद्धिमत्ता प्रसंस्करण की दक्षता और सटीकता में सुधार करना है। यह मॉडल OCR पाठ स्थिति निर्धारण और पहचान कार्यों को जोड़ता है, और दस्तावेज़ छवियों पर तेज़ और सटीक पाठ का पता लगाने और पहचान करने में सक्षम है। सीमित कम्प्यूटिंग संसाधनों और पूर्व प्रशिक्षण डेटासेट के आकार के साथ, ViTLP-medium (380M पैरामीटर) का पूर्व प्रशिक्षित संस्करण एक संतुलित समाधान प्रदान करता है जो मॉडल के प्रदर्शन को सुनिश्चित करता है और साथ ही अनुमान गति और मेमोरी उपयोग को अनुकूलित करता है। Nvidia 4090 पर ViTLP की अनुमान गति आम तौर पर एक पृष्ठ दस्तावेज़ छवि को संसाधित करने में 5 से 10 सेकंड के बीच होती है, जो अधिकांश OCR इंजनों की तुलना में प्रतिस्पर्धी है।
वेबसाइट खोलें

ViTLP नवीनतम ट्रैफ़िक स्थिति

मासिक कुल विज़िट

474564576

बाउंस दर

36.20%

प्रति विज़िट औसत पृष्ठ

6.1

औसत विज़िट अवधि

00:06:34

ViTLP विज़िट प्रवृत्ति

ViTLP विज़िट भौगोलिक वितरण

ViTLP ट्रैफ़िक स्रोत

ViTLP विकल्प