我目前正在尝试用Python写一个函数,它允许我从.docx
文件中提取文本。为此,我使用python-docx
库。我的程序也做了它应该做的事情,至少当我在Python中创建一个docx
文件,然后在这个文件上使用我的函数时,它会返回文本给我。
然而,对于我修改或创建的.docx
文件(Word文档),它找不到路径并返回PackageNotFoundError
。我在互联网上检查我的文件是否是zip文件。我用zipfile做了这件事,事实上我保存的Word文档不是zipfile。这是怎么回事?我再次验证的python代码:
from zipfile import is_zipfile
import docx
doc = docx.Document()
doc.add_paragraph("Hello")
doc.save(test_path)
print(is_zipfile(test_path))
//output = true
字符串
如果我进入这个test_path,输入一个数字并保存->
print(is_zipfile(test_path))
//output = false
型
现代的.docx文档不再是zip文件了吗?或者这里有什么问题?
当谷歌无处不在写的Word文档/.docx文件是zip文件。我认为这就是为什么图书馆给我的错误代码,无法打开文件的问题。我很感激大家试图帮助。谢谢
1条答案
按热度按时间zsohkypk1#
如果您想要对最终文档进行更多控制,或者想要更改现有文档,则需要使用文件名打开一个文档:
字符串