我想读取一些CSV文件。它们都有一个共同的特定列,比如'b'
。对于每个文件,我想计数不同的b
。
示例
例如,假设我有10个文件,每个文件有5列(a
,b
,c
,d
,e
)和许多行。
如何获得一个汇总表,显示每个文件有多少个b
的不同值?
import numpy as np
import pandas as pd
n = 1000
columns = list('abcde')
np.random.seed(0)
for i in range(10):
filename = f'file_{i:02d}.csv'
pd.DataFrame(
np.random.randint(0, 1000, (n, len(columns))),
columns=columns,
).to_csv(filename, index=False)
字符串
我想得到一个Pandas DataFrame,
filename count
file_00.csv 10
file_01.csv 3
...
型
1条答案
按热度按时间deikduxw1#
字符串
**额外的好处:存储具有每个第一个不同
b
-**的行如果列是兼容的,您还可以为每个文件存储具有不同
b
的第一行:型