目前我正在做一个时间序列项目。我有超过5年时间跨度的每日数据点。在这段时间内,有些天数为0,有些天数缺失。例如:
2015-01-10 343
2015-03-10 128
十月的第二天不见了。为了建立一个好的时间序列模型,我想每月对数据进行重采样:
df.individuals.resample("M").sum()
但我得到了以下输出:
2015-01-31 343.000000
2015-02-28 NaN
2015-03-31 64.500000
不知怎的,几个月完全错了。
预期输出如下所示:
2015-31-10 Sum of all days
2015-30-11 Sum of all days
2015-31-12 Sum of all days
1条答案
按热度按时间6jygbczu1#
Pandas正在将您的日期解释为%y-%m-%d。在进行重采样之前,应明确指定日期格式。试试这个: