python 维持PyPDF2的替代物

f4t66c6m  于 2023-01-01  发布在  Python
关注(0)|答案(2)|浏览(255)

我使用PyPDF2库从pdf文档中提取文本、图像、页面宽度和高度、注解和其他属性,但是这个库有很多bug和问题,seems not to be maintained已经存在很长时间了。PyPDF2被再次保留

  • 有没有更生动的分叉正在被维护和开发?
  • 有没有好的替代方案?

据我所知,reportlab更适合创建全新的pdf文件(或者也许我对reportlab还不够有经验)。

wvyml7n5

wvyml7n51#

更新:pypdf再次维护-我是(pypdf和PyPDF2的)维护者:-)我刚刚发布了一个新版本,修复了几个bug。
再看the top PyPI packages,PyPDF2也是使用最多的一个(而pypdf==3.1.0PyPDF2==3.0.0几乎是一样的,社区只需要一点时间就可以切换到pypdf)
保持三种潜在替代品(就像pypdf):

我不会使用:

  • PyPDF2:我是维护者,2022年12月我做了最后一个版本,我希望社区切换到pypdf(我也是维护者)
  • PyPDF3pypi):与PyPDF2相比,活动较少,功能也可能较少。
  • PyPDF4pypi):2018年PyPI上一次发布
xzlaal3s

xzlaal3s2#

PyMuPDF是MuPDF的Python绑定-* 一个轻量级的PDF和XPS查看器 *。因为MuPDF不仅支持PDF,而且支持XPS、OpenXPS、CBZ、CBR、FB2和EPUB格式,所以PyMuPDF也是如此。PyMuPDF托管在GitHub上。我们也在PyPI上注册。
它的性能统计数据也非常有希望。以下是处理性能不同方面的三个部分:

  • 文件剖析
  • 文本抽取
  • 图像渲染

PyMuPDF is the faster than pdfrw, PyPDF2, and pdftk.

相关问题