我正在使用pdf2image将pdf转换为图像,并使用表格转换器检测表格。我需要你帮我定位。
问题是,我得到了完美的表格边框,但图像中的像素与PDF坐标不同。如何将图像坐标转换为PDF坐标?下面是我的代码以供参考:
from pdf2image import convert_from_path
images = convert_from_path('/content/Sample Statement Format Bancslink.pdf')
for i in range(len(images)):
images[i].save('/content/pages_sbi/page'+str(i)+'.jpeg')
2条答案
按热度按时间icnyk63a1#
下面是如何使用PyMuPDF将图像坐标转换回PDF页面坐标。
这当然是一页一页地工作。因此,在下文中,假设图像文件是从对应的页面制成的。
顺便说一句,PyMuPDF还能够将页面渲染为图像。因此,如果你的表检测机制可以逐页调用,你可以这样做一个循环:
1.使用PyMuPDF读取页面
1.将页面转换为图像。可能也在记忆里。
1.将页面图像传递给表识别器,后者返回表坐标
1.使用表格坐标并将其转换为页面坐标,如上所示。
zxlwwiss2#
好吧,找到了完美的解决方案,几乎可以解决所有问题。
请将以下代码视为PDF to Image的代码:
现在,您需要首先获取PDF的数据:
现在读取并获取有关图像的数据:
现在考虑x_1,x_2,y_1和y_2作为图像中的坐标。要在PDF中获取相同的位置,请使用以下代码:
将此坐标用于您的工作。