我有一个接近10000文本文档,我需要转换/保存成.html,并使用python转换成pdf。
我尝试了一个叫做‘TextToHTML’的包
可以使用
pip install texttohtml
字符串
从终端:
python -m texttohtml.convert C:\Users\User\Downloads\AAPL -o C:\Users\User\Downloads\AAPL_pdfs
型
但没有成功。我运行了两次,它仍然没有给予我任何错误,或者它创建了任何html文档。
x1c 0d1x的数据
2条答案
按热度按时间mrzz3bfm1#
我不对任何丢失的数据负责。
这应该贯穿您的目录,并尝试转换每个文件:
字符串
-o意味着成功时,它将写入文件,而不是写入stdout。
我建议你在所有文件上尝试之前先测试一下。
此外,这将只转换为HTML文件,而不是PDF。
n53p2ov02#
字符串
这对我转换为HTML是有用的。我需要进一步的工作转换每个html文档为pdf