PaddleOCR v2.8.0 एक मील का पत्थर अपडेट के साथ पेडल गहराई से सीखने के ओपन-सोर्स ढांचे के तहत पाठ पहचान विकास किट के रूप में जारी किया गया है। इस संस्करण ने अग्रणी OCR तकनीक को पेश किया है, जिसमें PaddleOCR एल्गोरिदम मॉडल चुनौती प्रतियोगिता के विजेता समाधान शामिल हैं, जैसे दृश्य पाठ पहचान एल्गोरिदम SVTRv2 और तालिका पहचान एल्गोरिदम SLANet-LCNetV2, जो OCR क्षेत्र के लिए नए मानक स्थापित करते हैं।

साथ ही, परियोजना संरचना को गहराई से अनुकूलित किया गया है, गैर-कोर मॉड्यूल को नए भंडार में स्थानांतरित किया गया है, जिससे परियोजना OCR कोर तकनीक पर अधिक केंद्रित हो गई है। इसके अलावा, बैकबोन अपडेट करने के बाद मॉडल का न चलना, numpy संस्करण निर्भरता संघर्ष, Mac सिस्टम पर रुकावट जैसी ऐतिहासिक समस्याओं को हल किया गया है, जिससे उपयोगकर्ता अनुभव में सुधार हुआ है।

微信截图_20240712084427.png

नए संस्करण में लेआउट विश्लेषण में OCR परिणामों के खोने की समस्या का समाधान शामिल है, PEP518 मानक के अनुरूप pyproject.toml पेश किया गया है, और बड़े चित्र निष्पादन के लिए स्लाइडिंग विंडो संचालन जैसे अनुकूलन सुधार शामिल हैं, जिससे सॉफ़्टवेयर की स्थिरता, संगतता और प्रदर्शन में सुधार हुआ है। ओपन-सोर्स समुदाय का समर्थन और योगदान PaddleOCR v2.8.0 की प्रत्येक प्रगति के लिए महत्वपूर्ण है, PMC सदस्यों और योगदानकर्ताओं के प्रयासों को विशेष धन्यवाद दिया गया है।

PaddleOCR एक विशेष दस्तावेज़ ट्यूटोरियल साइट का निर्माण कर रहा है, जो कीवर्ड खोज फ़ंक्शन और सुरुचिपूर्ण, आरामदायक इंटरफ़ेस प्रदान करेगा।

परियोजना का पता: https://github.com/PaddlePaddle/PaddleOCR