导入按列分隔的CSV文件[重复]

wn9m85ua  于 2023-01-15  发布在  其他
关注(0)|答案(1)|浏览(207)
    • 此问题在此处已有答案**:

Customizing the separator in pandas read_csv(4个答案)
How to set a custom separator in pandas to_csv()?(6个答案)
Python pandas read_csv with custom separator(1个答案)
2天前关闭。
我尝试导入一个CSV文件使用Pandas,这通常不是一个问题,但现在这个文件不是用逗号分隔,而是每个字段在不同的列中,看起来像:

2020-01-01;2020-01-01 00:00:00.0;2020-01-01 00:05:00.0;SE3;1205.864
2020-01-01;2020-01-01 00:05:00.0;2020-01-01 00:10:00.0;SE3;1211.574
2020-01-01;2020-01-01 00:10:00.0;2020-01-01 00:15:00.0;SE3;1217.963
2020-01-01;2020-01-01 00:15:00.0;2020-01-01 00:20:00.0;SE3;1224.422

我第一次尝试这种方法

df = pd.read_csv(r'C:\Users\simon\Desktop\Vindkraftsprognos∩2020 elområde 5 min.csv')

它可以创建DataFrame,但所有数据都在单个列中。
我还尝试将文件的扩展名更改为"xlsx",并使用以下代码:

svk_df = pd.read_excel(r"C:\Users\simon\Desktop\Vindkraftsprognos∩2020 elområde 5 min.xlsx")

这给我一个错误ValueError: Worksheet index 0 is invalid, 0 worksheets found
任何帮助如何解决这个问题将不胜感激。谢谢。
编辑:将图片改为文本。还尝试了答案中的解决方案:

result = pd.read_csv(r'C:\Users\simon\Desktop\Vindkraftsprognos∩2020 elområde 5 min.csv', sep='\s+',header=None)

这给了我三列,excel文件中有五列。

0                      1                        2
0  2020-01-01;2020-01-01  00:00:00.0;2020-01-01  00:05:00.0;SE3;1205.864
1  2020-01-01;2020-01-01  00:05:00.0;2020-01-01  00:10:00.0;SE3;1211.574
2  2020-01-01;2020-01-01  00:10:00.0;2020-01-01  00:15:00.0;SE3;1217.963
3  2020-01-01;2020-01-01  00:15:00.0;2020-01-01  00:20:00.0;SE3;1224.422
4  2020-01-01;2020-01-01  00:20:00.0;2020-01-01   00:25:00.0;SE3;1230.81
wqsoz72f

wqsoz72f1#

这应该工作正常。你可以尝试改变sep="|"也作为评论。
注意:最好使用相对路径与Pandas考虑把数据集在同一文件夹中的脚本。

result = pd.read_csv(r'C:\Users\simon\Desktop\Vindkraftsprognos∩2020 elområde 5 min.csv', sep=';',header=None)

相关问题