时间序列重采样,错误输出,无频率

6l7fqoea  于 2021-09-08  发布在  Java
关注(0)|答案(1)|浏览(453)

目前我正在做一个时间序列项目。我有超过5年时间跨度的每日数据点。在这段时间内,有些天数为0,有些天数缺失。例如:

2015-01-10  343
2015-03-10  128

十月的第二天不见了。为了建立一个好的时间序列模型,我想每月对数据进行重采样:

df.individuals.resample("M").sum()

但我得到了以下输出:

2015-01-31    343.000000
2015-02-28           NaN
2015-03-31     64.500000

不知怎的,几个月完全错了。
预期输出如下所示:

2015-31-10  Sum of all days
2015-30-11  Sum of all days
2015-31-12  Sum of all days
6jygbczu

6jygbczu1#

Pandas正在将您的日期解释为%y-%m-%d。在进行重采样之前,应明确指定日期格式。试试这个:

df.index = pd.to_datetime(df.index, format="%Y-%d-%m")
>>> df.resample("M").sum()
2015-10-31  471

相关问题