这应该很容易,但我有错误,我不能工作了。我有一些英国的空气污染数据,我想分析一下。
https://uk-air.defra.gov.uk/data/DAQI-regional-data?regionIds%5B%5D=999&aggRegionId%5B%5D=999&datePreset=6&startDay=01&startMonth=01&start Year=2022&endDay=01&endMonth=01&endYear=2023&queryId=&action=step2&go=Next+
但是使用read_html会导致错误:
ParserError: Error tokenizing data. C error: Expected 1 fields in line 7, saw 2
df = pd.read_html("https://uk-air.defra.gov.uk/data/DAQI-regional-data?regionIds%5B%5D=999&aggRegionId%5B%5D=999&datePreset=6&startDay=01&startMonth=01&startYear=2022&endDay=01&endMonth=01&endYear=2023&queryId=&action=step2&go=Next+")
df
这将以列表的形式返回数据。但是我想把这个列表变成一个 Dataframe 。
解决这个问题的最好方法是什么?
3条答案
按热度按时间igetnqfo1#
read_html
总是返回一个 DataFrames 的列表,即使只有一个。你需要索引它。pandas.read_html
返回dfs Dataframe 列表。
输出:
nmpmafwu2#
Panadas
read_html
实际上处理这样的情况:h6my8fg23#
我的准则