PaddleOCR v2.8.0は、飛桨(PaddlePaddle)深層学習オープンソースフレームワークにおける文字認識開発キットとして、画期的なアップデートを行いました。このバージョンでは、シーンテキスト認識アルゴリズムSVTRv2や表認識アルゴリズムSLANet-LCNetV2など、PaddleOCRアルゴリズムモデルチャレンジの優勝手法を含む最先端のOCR技術が導入され、OCR分野における新たな基準を打ち立てました。
同時に、プロジェクト構造が大幅に最適化され、非コアモジュールは新しいリポジトリに移行されました。これにより、プロジェクトはOCRコア技術に一層集中できるようになりました。さらに、バックボーン更新後のモデル実行不可、NumPyバージョン依存関係の競合、Macシステムでの動作の遅延など、長年の問題も解決され、ユーザーエクスペリエンスが向上しました。
新バージョンでは、レイアウト解析におけるOCR結果の欠損問題の修正、PEP518規格に準拠したpyproject.tomlの導入、大画像推論のスライディングウィンドウ操作の最適化など、安定性、互換性、パフォーマンスが強化されました。PaddleOCR v2.8.0の進化には、オープンソースコミュニティの支援と貢献が不可欠であり、PMCメンバーとコントリビューターの努力に深く感謝いたします。
PaddleOCRでは、キーワード検索機能と快適なインターフェースを提供するドキュメントチュートリアル専用のウェブサイトを構築中です。
プロジェクトアドレス:https://github.com/PaddlePaddle/PaddleOCR