就像这样,检测得到的box重叠,导致最后的文本识别结果多一个字。我试了调小det_db_unclip_ratio,但是调小了就有把 7
识别成 /
的概率,并且还是会有交叉,就是交叉变成半个字符(这就使识别结果更糟糕了)。
请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem
系统环境/System Environment:ubuntu 20.04, cuda 11.6
版本号/Version:
Paddle:2.3.2.post116
PaddleOCR: 2.6.0.2
问题相关组件/Related components:文本检测模型en_PP-OCRv3_det_infer
1条答案
按热度按时间gupuwyp21#
4518 (comment) 根据作者的说法,是DB的缺陷,只能通过后处理解解决。不过我个人建议可以试试把标注数据的框变小,成为一个个小块,这样应该可以很大程度避免这种问题。