我有一个月/天时间的时间序列,后面跟着值。由于设备故障,某些时间缺失。我想替换这些时间(例如下面的21:00、01:00)并插入与它们关联的缺失值。执行此操作的好方法是什么?
数据如下所示:
03/31 19:00 68.0
03/31 20:00 68.0
03/31 22:00 70.0
03/31 23:00 68.0
04/01 00:00 69.0
04/01 02:00 70.0
"04/01 00:00"
值是字符串,观测值是浮点数。
我使用以下命令将字符串日期转换为数字:date_number=datetime.strptime(col_1[i],'%m/%d %H:%M')
,结果是"1900-03-31 19:00:00"
。我可以对这些进行算术运算,找到空白,填充它们,并将nans放在另一列的相同位置,然后插值那些缺失的值。我相信有一种更有效,更标准的方法来解决这个问题,我想知道如何最好地做到这一点。
1条答案
按热度按时间xlpyo6sf1#
假设下面的dataframe:
你可以创建一个
Series
索引的Date
来真正地在TimeSeries上工作:输出: