print(files)
结果如下:
4)筛选出以.xlsx结尾的Excel表格
tables = []
path = os.getcwd()
for path,dirs,files in os.walk(path):
for i in files:
if i.split(“.”)[1] == “xlsx”:
tables.append(i)
tables
结果如下:
5)组织数据,便于后续写入到Excel中
这里特别说明一点,组织好的数据应该是一个列表嵌套,内层的每一个列表,就是Excel表格中的每一行。
final_data = []
for table in tables:
lis = []
wb = load_workbook(table)
sheet = wb[wb.sheetnames[0]]
max_row = sheet.max_row
lis.append(table)
lis.append(max_row)
final_data.append(lis)
final_data
结果如下:
6)新建一个Excel表格,并循环插入数据
new_wb = Workbook()
sheet = new_wb.active
sheet.title = “最终数据”
sheet.append(["文件名 ",“行数”])
for row in final_data:
sheet.append(row)
new_wb.save(filename=“结果.xlsx”)
结果如下:
3. 完整代码为了文章的完整性,我在文章最后放上我的代码。但是限于文章篇幅,最后我只粘贴一张图片,详细代码,大家可以去文末获取。
获取本文完整代码和用到的素材!
数据分析与统计学之美:
链接:https://pan.baidu.com/s/1shAk-jdSn7nb55GXZpnXpg
提取码:pi1z
参考链接 :
Python+os+openpyxl 批量获取Excel的文件名和最大行数
:https://mp.weixin.qq.com/s/VvKT7A0cIt69kbdGDQ8xLw