एक्सट्रैक्टस

तेज़ और कुशल असंरचित डेटा निष्कर्षण उपकरण

सामान्य उत्पादप्रोग्रामिंगnlprust
एक्सट्रैक्टस एक असंरचित डेटा निष्कर्षण उपकरण है जो Rust में लिखा गया है और इसमें बहुभाषी बंधन हैं। यह विभिन्न प्रकार की फ़ाइलों (जैसे PDF, Word, HTML आदि) से सामग्री और मेटाडेटा निकालने पर केंद्रित है, और यह उच्च प्रदर्शन और कम मेमोरी उपयोग के साथ आता है। एक्सट्रैक्टस नेटिव कोड निष्पादन के माध्यम से तेज़ प्रसंस्करण गति और कम मेमोरी उपयोग प्राप्त करता है, कई फ़ाइल स्वरूपों का समर्थन करता है, और Apache Tika और tesseract-ocr तकनीक को एकीकृत करता है, जिससे यह व्यापक फ़ाइल प्रकारों को संभाल सकता है और OCR पहचान कर सकता है। इस उपकरण का ओपन-सोर्स स्वभाव और Apache 2.0 लाइसेंस इसे व्यावसायिक उपयोग के लिए मुफ़्त बनाते हैं, जो बड़ी मात्रा में दस्तावेज़ डेटा को संभालने वाले उद्यमों और डेवलपर्स के लिए उपयुक्त है।
वेबसाइट खोलें

एक्सट्रैक्टस नवीनतम ट्रैफ़िक स्थिति

मासिक कुल विज़िट

474564576

बाउंस दर

36.20%

प्रति विज़िट औसत पृष्ठ

6.1

औसत विज़िट अवधि

00:06:34

एक्सट्रैक्टस विज़िट प्रवृत्ति

एक्सट्रैक्टस विज़िट भौगोलिक वितरण

एक्सट्रैक्टस ट्रैफ़िक स्रोत

एक्सट्रैक्टस विकल्प