L'équipe de PaddlePaddle de Baidu a annoncé le lancement de PP-ChatOCR, un outil d'extraction d'informations clés d'images généralisées basé sur le grand modèle linguistique Wenxin. Cet outil combine la reconnaissance optique de caractères (OCR) et la technologie des grands modèles linguistiques, permettant l'extraction d'informations clés à partir d'images dans divers contextes.
PP-ChatOCR est désormais disponible sur PaddleX, permettant aux développeurs de l'entraîner et de l'affiner sur cette plateforme, ainsi que de déployer des versions haute performance. L'outil a démontré une excellente précision et stabilité dans de nombreux scénarios.