O PaddleOCR v2.8.0, um kit de desenvolvimento de reconhecimento de texto sob o framework de aprendizado profundo de código aberto PaddlePaddle, lançou uma atualização histórica. Esta versão introduz tecnologias OCR de ponta, incluindo soluções vencedoras do desafio de modelos de algoritmos PaddleOCR, como o algoritmo de reconhecimento de texto em cena SVTRv2 e o algoritmo de reconhecimento de tabela SLANet-LCNetV2, estabelecendo um novo padrão para o campo OCR.
Simultaneamente, a estrutura do projeto foi profundamente otimizada, com módulos não essenciais migrados para um novo repositório, permitindo que o projeto se concentre mais nas tecnologias essenciais de OCR. Além disso, foram resolvidos problemas históricos difíceis, incluindo a impossibilidade de execução do modelo após a atualização do Backbone, conflitos de dependência da versão numpy e lentidão na execução em sistemas Mac, melhorando a experiência do usuário.
A nova versão também inclui a correção do problema de perda de resultados OCR na análise de layout, a introdução de pyproject.toml para conformidade com a especificação PEP518 e otimizações como a operação de janela deslizante para inferência de imagens grandes, aumentando a estabilidade, compatibilidade e desempenho do software. O suporte e as contribuições da comunidade de código aberto são cruciais para cada avanço do PaddleOCR v2.8.0, e os membros do PMC e os contribuidores são especialmente agradecidos.
O PaddleOCR está construindo um site exclusivo para tutoriais e documentação, que oferecerá recursos de pesquisa por palavras-chave e uma interface elegante e confortável.
Endereço do projeto: https://github.com/PaddlePaddle/PaddleOCR