pdfdeal
PythonでDoc2X APIをラップした、PDF処理強化ツール。
一般製品プログラミングPDF処理OCR
pdfdealは、PythonでDoc2X APIをラップしたローカルPDF処理ツールです。RAGにおけるPDFのrecall率向上を目指し開発されました。テキスト、Markdown、PDFなど、複数の出力形式に対応し、OCR言語のカスタマイズやGPUアクセラレーションにも対応しています。Doc2Xサービスを利用しており、毎日500ページの無料利用枠があります。特に表や数式の認識に優れています。
pdfdeal 最新のトラフィック状況
月間総訪問数
474564576
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:34