MinerU
PDFをMarkdownおよびJSON形式に変換する、ワンストップ型の高品質なオープンソースデータ抽出ツールです。
一般製品生産性PDF変換Markdown
MinerUは、PDFファイルをMarkdownやJSONなどの機械可読形式に変換することに特化したオープンソースツールです。これにより、コンテンツの抽出とさらなる処理が容易になります。科学文献における記号変換の問題に対応し、複数の出力形式をサポートし、様々なオペレーティングシステムと互換性があります。MinerUの主な利点としては、ヘッダー、フッター、脚注などの除去によるドキュメント本来の構造の維持、ドキュメント内の数式や表の自動認識と変換、OCR機能のサポート、84言語もの検出と認識をサポートすることが挙げられます。
MinerU 最新のトラフィック状況
月間総訪問数
474564576
直帰率
36.20%
平均ページ/訪問
6.1
平均訪問時間
00:06:34