此问题在此处已有答案:
Import multiple CSV files into pandas and concatenate into one DataFrame(20个答案)
How do I select rows from a DataFrame based on column values?(17个回答)
21小时前关闭
假设我有一个根目录(文件夹)z
,i
有三个子目录(文件夹)a, b,
和c
每个a, b,
和c
都包含一个csv
文件,这些文件是类似的数据,具有类似的名称a_data, b_data,
和c_data)
在三个csv
文件中,只有一个csv
包含 Dataframe 内的整数100
的值。``
如何设计一个循环,扫描三个子文件夹中的所有csv
,并告诉我哪个csv
的值为“100”?
非常感谢!
3条答案
按热度按时间lskq00tm1#
我现在还不能描述我的想法,但我认为用Pandas打开每个文件比在Pandas中打开CSV之前先搜索CSV的文本要快。而且,它可能会读得更好。
因此,假设使用Pandas打开所有内容比使用CSV library之类的东西更快,让我们这样做:
字符串
最终,嵌套的if并不漂亮。但是,如果没有看到你的代码,很难找到合适的。如果你能发布你的代码,那会有所帮助。否则,希望上面的内容能帮助你开始。
8cdiaqws2#
字符串
mnemlml83#
你可以像这样遍历
csv_files
列表,阅读读取每一个使用pandas.read_csv
并找到第一个具有所需值的列表。如果循环正常结束(即不在break
上),对应于没有包含所需值的文件,则for
循环的else
子句将被执行。字符串