Python自动化办公:27行代码实现将多个Excel表格内容批量汇总合并到一个表格

x33g5p2x  于2022-04-14 转载在 Python  
字(1.3k)|赞(0)|评价(0)|浏览(567)

序言

老板最近越来越过分了,快下班了发给我几百个表格让我把内容合并到一个表格内去。

还好我会Python,分分钟就搞定了,这要是换个不会Python的,不得加班到第二天天亮去了~

这么好用的技能,必须分享给大家,话不多说,咱们直接开始!

准备工作

咱们需要先准备表格数据,会爬虫的兄弟可以自己爬一点,不会的,可以找我直接拿数据。
电脑端左侧获取,手机端最最最下方获取

表格内数据


我这里只做展示,所以只用了五个表,咱们今天是将市级合并为省级。

本文思路

  1. 将当前文件夹下所有的 excel 汇总到 广东省.xlsx
  2. 添加一个新的字段 城市,字段内容为商铺所在城市,这个字段放在最前面;
  3. 星级为 star_0 的数据全部不要
  4. 只要一条数据中有三个字段为空字段,整条数据都不需要;
  5. 将价格中的 ¥ 符号去掉

代码实现

全部代码都分享给大家,咱不喜欢藏着掖着。

  1. import glob
  2. import openpyxl
  3. workbook = openpyxl.Workbook()
  4. sheet_total = workbook.active
  5. sheet_total.append(['城市', '门店名称', '星级', '星级得分', '点评总数', '人均消费', '口味', '环境', '服务', '链接网址', '分类', '商圈', '详细地址', '推荐菜'])
  6. def count_none(line):
  7. """返回空内容的数据"""
  8. count = 0
  9. for d in line:
  10. if not d:
  11. count += 1
  12. return count
  13. filenames = glob.glob('*/*.xlsx')
  14. for filename in filenames:
  15. # print(filename)
  16. city = filename.split('.')[0].split('\\')[-1]
  17. workbook_temp = openpyxl.load_workbook(filename)
  18. sheet = workbook_temp.active
  19. for row in sheet.iter_rows(min_row=2, min_col=1, max_col=sheet.max_column, max_row=sheet.max_row):
  20. row_data = [col.value for col in row]
  21. if row_data[1] == 'star_0':
  22. continue
  23. # 定义一个方法判断空字段的数量
  24. if count_none(row_data) >= 3:
  25. continue
  26. # 去掉平均价格中的 ¥
  27. if row_data[4]:
  28. row_data[4] = row_data[4].strip('¥')
  29. row_data.insert(0, city)
  30. # print(row_data)
  31. sheet_total.append(row_data)
  32. # break # 调试只处理一个
  33. workbook.save('广东省.xlsx')

效果

还是刚出炉的,非常新鲜。


这我做了筛选,不然全是显示一个地方了。
可以看到,数据成功的合并到一个表格去了。

喜欢的小伙伴记得点赞收藏呀~
关注我分享更多技术干货
直接拿走代码等于白嫖,点赞收藏才是真情…
你们的支持是我更新的动力!

相关文章