python 维持PyPDF2的替代物

f4t66c6m 于 2023-01-01 发布在 Python

关注(0)|答案(2)|浏览(263)

我使用PyPDF2库从pdf文档中提取文本、图像、页面宽度和高度、注解和其他属性，但是这个库有很多bug和问题，seems not to be maintained已经存在很长时间了。PyPDF2被再次保留）

有没有更生动的分叉正在被维护和开发？
有没有好的替代方案？

据我所知，reportlab更适合创建全新的pdf文件（或者也许我对reportlab还不够有经验）。

python

来源：https://stackoverflow.com/questions/63199763/maintained-alternatives-to-pypdf2

2条答案

按热度按时间

wvyml7n51#

更新：pypdf再次维护-我是（pypdf和PyPDF2的）维护者：-）我刚刚发布了一个新版本，修复了几个bug。
再看the top PyPI packages，PyPDF2也是使用最多的一个（而pypdf==3.1.0和PyPDF2==3.0.0几乎是一样的，社区只需要一点时间就可以切换到pypdf）
保持三种潜在替代品（就像pypdf）：

pymupdf：使用mupdf（由于mypdf许可证，仅适用于开源）
pikepdf：使用qpdf
pdfminer.six：一个纯Python项目。

我不会使用：

PyPDF2：我是维护者，2022年12月我做了最后一个版本，我希望社区切换到pypdf（我也是维护者）
PyPDF3（pypi）：与PyPDF2相比，活动较少，功能也可能较少。
PyPDF4（pypi）：2018年PyPI上一次发布

赞(0）回复(0）举报 2023-01-01

xzlaal3s2#

PyMuPDF是MuPDF的Python绑定-* 一个轻量级的PDF和XPS查看器 *。因为MuPDF不仅支持PDF，而且支持XPS、OpenXPS、CBZ、CBR、FB2和EPUB格式，所以PyMuPDF也是如此。PyMuPDF托管在GitHub上。我们也在PyPI上注册。
它的性能统计数据也非常有希望。以下是处理性能不同方面的三个部分：

文件剖析
文本抽取
图像渲染

PyMuPDF is the faster than pdfrw, PyPDF2, and pdftk.

赞(0）回复(0）举报 2023-01-01

我来回答

python 维持PyPDF2的替代物

2条答案

相关问题

热门标签

最新问答