PaddleOCR v2.8.0, ein Texterkennungs-Entwicklungskit innerhalb des Open-Source-Deep-Learning-Frameworks PaddlePaddle, wurde mit einem Meilenstein-Update veröffentlicht. Diese Version integriert modernste OCR-Technologien, darunter die Gewinnerlösungen des PaddleOCR-Algorithmus-Modellwettbewerbs, wie den Szenentext-Erkennungsalgorithmus SVTRv2 und den Tabellen-Erkennungsalgorithmus SLANet-LCNetV2, und setzt damit neue Standards im OCR-Bereich.
Gleichzeitig wurde die Projektstruktur umfassend optimiert. Nicht-Kernmodule wurden in ein neues Repository verschoben, um den Fokus auf die Kerntechnologien von OCR zu legen. Darüber hinaus wurden langjährige Probleme wie die Nicht-Funktionsfähigkeit von Modellen nach Backbone-Updates, Konflikte mit der NumPy-Versionsabhängigkeit und Leistungseinbußen auf Mac-Systemen behoben, was die Benutzerfreundlichkeit deutlich verbessert.
Die neue Version beinhaltet außerdem die Behebung des Problems des Verlusts von OCR-Ergebnissen bei der Layoutanalyse, die Einführung von pyproject.toml zur Einhaltung der PEP518-Spezifikation und Optimierungen wie die Gleitfenster-Operation für die Inferenz großer Bilder. Dies verbessert die Stabilität, Kompatibilität und Leistung der Software. Die Unterstützung und Beiträge der Open-Source-Community waren für jeden Fortschritt von PaddleOCR v2.8.0 entscheidend. Die Mitglieder des Projektmanagementkomitees (PMC) und die Mitwirkenden werden besonders gewürdigt.
PaddleOCR entwickelt derzeit eine eigene Website für Dokumentationen und Tutorials, die eine Keyword-Suchfunktion und eine benutzerfreundliche Oberfläche bieten wird.
Projekt-Adresse: https://github.com/PaddlePaddle/PaddleOCR