unilm TROCR用于矩形图像

ct3nt3jp  于 2个月前  发布在  其他
关注(0)|答案(2)|浏览(48)

TrOCR是否适合用于手写文本识别,对于宽高比为5-6的图像(例如600100大小的图像)?
TrOCR将输入图像调整为384
384的正方形图像,这会严重扭曲图像。

ltqd579y

ltqd579y2#

我认为它在那里 -
unilm/trocr/data_aug.py
第34行 in b60c741
| | classResizePad(object): |
但我没有时间进一步探索它。

相关问题