pdf-extract-api

API de alta precisión para convertir imágenes o PDF en texto Markdown o documentos estructurados JSON.

Producto ComúnProductividadapipdf
pdf-extract-api es una API que utiliza tecnología OCR moderna y modelos compatibles con Ollama para convertir cualquier documento o imagen en texto Markdown o JSON estructurado. Construida con FastAPI y utilizando Celery para el procesamiento de tareas asíncronas y Redis para el almacenamiento en caché de los resultados OCR. La API no requiere la nube ni dependencias externas; todo el procesamiento se realiza localmente en un entorno de desarrollo o servidor, garantizando la seguridad de los datos. Admite la conversión de PDF a Markdown con alta precisión, incluyendo datos de tablas, números o fórmulas matemáticas, y la conversión de PDF a JSON utilizando modelos compatibles con Ollama. Además, la API admite la mejora de los resultados OCR mediante LLM, la eliminación de información de identificación personal (PII) de los PDF, el procesamiento de colas distribuidas y el almacenamiento en caché.
Abrir sitio web

pdf-extract-api Situación del tráfico más reciente

Total de visitas mensuales

474564576

Tasa de rebote

36.20%

Páginas promedio por visita

6.1

Duración promedio de la visita

00:06:34

pdf-extract-api Tendencia de visitas

pdf-extract-api Distribución geográfica de las visitas

pdf-extract-api Fuentes de tráfico

pdf-extract-api Alternativas