PaddleOCR 请问有什么参数设置可以使文本检测结果不交叉重叠?

55ooxyrt  于 2022-10-27  发布在  其他
关注(0)|答案(1)|浏览(408)

就像这样,检测得到的box重叠,导致最后的文本识别结果多一个字。我试了调小det_db_unclip_ratio,但是调小了就有把 7 识别成 / 的概率,并且还是会有交叉,就是交叉变成半个字符(这就使识别结果更糟糕了)。

请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem

  • 系统环境/System Environment:ubuntu 20.04, cuda 11.6

  • 版本号/Version:

  • Paddle:2.3.2.post116

  • PaddleOCR: 2.6.0.2

  • 问题相关组件/Related components:文本检测模型en_PP-OCRv3_det_infer

gupuwyp2

gupuwyp21#

4518 (comment) 根据作者的说法,是DB的缺陷,只能通过后处理解解决。不过我个人建议可以试试把标注数据的框变小,成为一个个小块,这样应该可以很大程度避免这种问题。

相关问题