unilm TrOCR - 分割问题

4szc88ey  于 5个月前  发布在  其他
关注(0)|答案(1)|浏览(56)

解:我们需要手动分割以下图像吗?TrOCR中是否有内置的分割模块?如果没有,我们是否可以利用一些外部工具来实现这个目的?

cu6pst1q

cu6pst1q1#

TrOCR仅用于文本识别。对于TrOCR,输入应该是标记级别的或行级别的,因此您需要使用文本检测工具进行行分割。我们有DiT用于文本检测,但您可能需要为您的应用提供行分割的训练数据。

相关问题