因此,当我试图读取印度尼西亚的出生时预期寿命(https://data.worldbank.org/indicator/SP.DYN.LE00.IN?locations=ID,如果你想查看的话,这是链接),简单地说,我不能,这是我的代码
import pandas as pd
import matplotlib.pyplot as plt
lifeexpectacion = pd.read_csv("API_SP.DYN.LE00.IN_DS2_en_csv_v2_4770434.csv")
print(lifeexpectacion)
错误是
File "D:\programaizar\data economy\main.py", line 4, in <module>
lifeexpectacion = pd.read_csv("API_SP.DYN.LE00.IN_DS2_en_csv_v2_4770434.csv")
3条答案
按热度按时间pprl5pva1#
CSV的前4行包含标题、上次更新日期等信息。您需要跳过数据文件的前4行。使用
pd.read_csv("API_SP.DYN.LE00.IN_DS2_en_csv_v2_4770434.csv", skiprows=4)
toiithl62#
我下载了链接文件,看看是否可以重新创建错误。This post也有类似的问题。
该csv的前四行是:
如果你把这些线去掉,它就会像预期的那样工作,是元数据让Pandas误以为只有两列,而实际上有六十七列。
jljoyd4f3#
对我有用