下面是我的代码:
v_excel= []
for root, dirs, files in os.walk(paths):
for t in files:
if t.endswith('.xlsx'):
df = pd.read_excel(os.path.join(paths,t), header=None, index_col=False)
v_excel.append(df)
conc = pd.concat(v_excel, axis=1, ignore_index=True)
浓度输出:
# after appending two excel files i can successively concat the files and put it in
# seperate column
column1 column2
data1 data1
data2 data2
data3 data3
data3 data4
# column 1 is from excel file 1 and column2 from excel file 2
如何像处理excel一样处理docx?
if t.endswith('.docx'):
#for c,z in enumerate(t):
v_doc.append(Document(t)) # <-----how to put this in df and concat according to
# docx file as i have done with excel ?
docx包含:#docx包含伪文本!!!
# docx1 contains:
data1
data2
data3
data4
# docx2 contains:
data5
data6
data7
data8
我想将docx文件的内容保存到excel的列中。将docx 1内容添加到excel的第1列,将docx 2添加到同一excel的第2列。
希望我能得到一些回应。先谢谢你。
2条答案
按热度按时间rbpvctlc1#
解决方案#1:将多个.docx文档聚合为单个输出docx文档。
如果希望将文本和样式从docx文档集合复制到单个输出docx,则可以使用pythondocx模块。
解决方案2:将多个.docx文档中的表内容聚合到单个输出excel文档中。
在注解中,您希望从一组具有文本表的word文档创建excel工作表。
下面是将word文档表中的单元格复制到目标excel文档的python代码。
解决方案#3:将多个.docx文档中的自定义表格内容聚合到具有2列表格的单个输出excel文档。
在您的特定示例数据中,表由3列或9列构成,因此如果希望在输出中保留2列,则需要将其他列的文本连接到单个值。
ygya80vv2#
您可以在python中将docxcompose转换为concat docx文件。您可以在docxcompose的pypi官方页面上阅读更多描述