PaddleOCR v2.8.0, como un kit de desarrollo de reconocimiento de texto bajo el marco de aprendizaje profundo de código abierto PaddlePaddle, ha lanzado una actualización histórica. Esta versión incorpora tecnología OCR de vanguardia, incluyendo soluciones ganadoras del concurso de algoritmos de PaddleOCR, como el algoritmo de reconocimiento de texto en escenas SVTRv2 y el algoritmo de reconocimiento de tablas SLANet-LCNetV2, estableciendo un nuevo estándar en el campo del OCR.

Simultáneamente, la estructura del proyecto ha sido profundamente optimizada, y los módulos no esenciales se han migrado a un nuevo repositorio, permitiendo que el proyecto se centre más en la tecnología central del OCR. Además, se han resuelto problemas históricos difíciles, incluyendo la imposibilidad de ejecutar el modelo después de actualizar Backbone, conflictos de dependencia de la versión de numpy y problemas de rendimiento en sistemas Mac, mejorando la experiencia del usuario.

微信截图_20240712084427.png

La nueva versión también incluye la corrección del problema de pérdida de resultados de OCR en el análisis de diseño, la introducción de pyproject.toml para cumplir con la especificación PEP518, y optimizaciones como la operación de ventana deslizante para la inferencia de imágenes grandes, mejorando la estabilidad, compatibilidad y rendimiento del software. El apoyo y las contribuciones de la comunidad de código abierto son cruciales para cada avance de PaddleOCR v2.8.0, y se agradece especialmente el esfuerzo de los miembros de PMC y los colaboradores.

PaddleOCR está construyendo un sitio web exclusivo para tutoriales y documentación, que ofrecerá una función de búsqueda por palabras clave y una interfaz elegante y cómoda.

Dirección del proyecto: https://github.com/PaddlePaddle/PaddleOCR