我正在使用一个超大的数据集,在我试图观察的时间跨度(1948 - 1960年)中有大约160万个条目,我的数据集在试图取平均值之前加载到Pandas中的一个例子看起来像this。
import pandas as pd
import pyreadr
data = pyreadr.read_r('C:/fileLocation/file.rds')
df = data[None]
df['time'] = pd.to_datetime(df['time'])
df.set_index('time', inplace=True)
df = df['1948':'1960']
print(df.info())
df_groups = df.groupby(['lat', 'lon'])['spei'].mean()
print(df_groups.head())
现在答案是get
输入/输出示例可能类似于follows
我所要做的是取成对的纬度和经度值,并取每对的平均spei值,然后用这些新的对和附加在那对上的spei值创建一个新的Pandas数据框,稍后再标绘出来。相反,我只得到了5行看似随机的纬度和经度值。而不是每个唯一的对与平均spei从所有重复的lon/lat值。我已经使用this post来尝试和帮助得到一些答案,但我还没有能够找到一个修复。
谢谢大家!
1条答案
按热度按时间lskq00tm1#
这应该可以解决您的问题:
该函数返回: