pandas 根据列值将Excel文件拆分为多个文件

xtfmy6hx  于 12个月前  发布在  其他
关注(0)|答案(1)|浏览(87)

我正试图将一个Excel文件拆分为多个不同的Excel文件,并将特定列的值分组。我还希望每个Excel文件都以分组的特定值命名。示例:一个员工有10条记录,他们都有员工ID在'EMPLOYEE'。这个员工将有所有10条记录在他们的文件和文件名将是他们的ID。我可以得到一些帮助吗?下面是我到目前为止的代码。

import pandas as pd #pip install pandas
import os

df = pd.read_excel('filename.xlsx')
column_name = 'EMPLOYEE'
unique_values = df[column_name].unique()

for unique_value in unique_values:
df_output = df[df[column_name].str.contains(unique_value)]
output_path = os.path.join('Lists', unique_value + '.xlsx')
df_output.to_excel(output_path, sheet_name=unique_value, index=False)

字符串

pkwftd7m

pkwftd7m1#

IIUC,试试这个:

import pandas as pd #pip install pandas
import os

df = pd.read_excel('filename.xlsx')
df.columns = df.columns.str.strip()
column_name = 'EMPLOYEE'
unique_values = df[column_name].unique()

for n, g in df.groupby(column_name):
    output_path = os.path.join('Lists', f'{n}.xlsx')
    g.to_excel(output_path, sheet_name=n, index=False)

字符串

相关问题