Extractous es una herramienta de extracción de datos no estructurados escrita en Rust que ofrece enlaces multi-idioma. Se centra en la extracción de contenido y metadatos de diversos tipos de archivos (como PDF, Word, HTML, etc.) con un rendimiento excepcional y un bajo consumo de memoria. Extractous, mediante la ejecución de código nativo, logra una velocidad de procesamiento rápida y un bajo consumo de memoria. Soporta múltiples formatos de archivo e integra las tecnologías Apache Tika y tesseract-ocr, lo que le permite procesar una amplia gama de tipos de archivos y realizar reconocimiento óptico de caracteres (OCR). La naturaleza de código abierto de la herramienta y su licencia Apache 2.0 permiten su uso gratuito para fines comerciales, siendo ideal para empresas y desarrolladores que necesitan procesar grandes cantidades de datos de documentos.