unstructured chore/ use word level bounding boxes for add_pytesseract_bbox_to_elements

rryofs0p  于 3个月前  发布在  其他
关注(0)|答案(1)|浏览(58)

根据这里的讨论(https://github.com/Unstructured-IO/unstructured/pull/1259/files#r1312235977),add_pytesseract_bbox_to_elements可以通过使用pytesseract.image_to_data和向量数学来找到元素的坐标进行改进。

相关问题