我有一些我正在处理的小时数据,以便识别记录数据中的时间间隔。我已经创建了一个timedelta值为零小时的time_break数组,当for循环找到这些值时,我将用数据中的实际时断替换这些值。对于400k值,这几乎需要17秒。。。我想加快这个过程。。你知道怎么做吗?谢谢
这是列日期的显示方式:
我的代码是:
delta_0h = timedelta(hours=0)
df_events['TimeBreak'] = delta_0h
time_break = df_events['TimeBreak'].to_numpy()
delta_1h = timedelta(hours=1)
def TimeLapse(df_events):
numel = len(df_events)
for r in range(1, numel):
delta = df_events.loc[r, 'DATES'] - df_events.loc[r-1, 'DATES']
if (delta > delta_1h):
time_break[r] = delta
return time_break
df_events['TimeBreak'] = TimeLapse(df_events)
我曾尝试将日期转换为numpy数组以优化函数,但我得到一个错误,即timestamp对象不可下标。
我想加快这个过程。。你知道怎么做吗?谢谢
暂无答案!
目前还没有任何答案,快来回答吧!