我使用PyPDF2
库从pdf文档中提取文本、图像、页面宽度和高度、注解和其他属性,但是这个库有很多bug和问题,seems not to be maintained已经存在很长时间了。PyPDF2被再次保留)
- 有没有更生动的分叉正在被维护和开发?
- 有没有好的替代方案?
据我所知,reportlab
更适合创建全新的pdf文件(或者也许我对reportlab还不够有经验)。
我使用PyPDF2
库从pdf文档中提取文本、图像、页面宽度和高度、注解和其他属性,但是这个库有很多bug和问题,seems not to be maintained已经存在很长时间了。PyPDF2被再次保留)
据我所知,reportlab
更适合创建全新的pdf文件(或者也许我对reportlab还不够有经验)。
2条答案
按热度按时间wvyml7n51#
更新:pypdf再次维护-我是(pypdf和PyPDF2的)维护者:-)我刚刚发布了一个新版本,修复了几个bug。
再看the top PyPI packages,PyPDF2也是使用最多的一个(而
pypdf==3.1.0
和PyPDF2==3.0.0
几乎是一样的,社区只需要一点时间就可以切换到pypdf)保持三种潜在替代品(就像pypdf):
pymupdf
:使用mupdf(由于mypdf许可证,仅适用于开源)pikepdf
:使用qpdfpdfminer.six
:一个纯Python项目。我不会使用:
pypdf
(我也是维护者)xzlaal3s2#
PyMuPDF是MuPDF的Python绑定-* 一个轻量级的PDF和XPS查看器 *。因为MuPDF不仅支持PDF,而且支持XPS、OpenXPS、CBZ、CBR、FB2和EPUB格式,所以PyMuPDF也是如此。PyMuPDF托管在GitHub上。我们也在PyPI上注册。
它的性能统计数据也非常有希望。以下是处理性能不同方面的三个部分:
PyMuPDF is the faster than pdfrw, PyPDF2, and pdftk.