我做了一个应用程序,通过许多建设类型的pdf文件,并找到这些文件中的具体标签。如果找到某个标记,我想将该文件名添加到列表中。我必须这样做,因为从这些PDF中提取文本不可能使用pypdf2,因为十六进制表示。ocr方法也不起作用,因为文本和工程图是啮合在一起的,很难阅读。因此,我正在制作一个应用程序来分别打开每个pdf文件,并使用ctrl-f特性来查找标记。在图形中找不到输入的标记时,pdf中将显示以下弹出窗口:我希望我的脚本检测何时发生这种情况,这样我就可以退出施工图而不需要所需的标记。
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!