我有一个长时间的大型数据集,其中包含多个个体,如下所示
event.id timestamp individual
1 2021-08-31 09:03:01 A
2 2021-08-31 10:02:11 A
3 2021-08-31 11:02:20 A
4 2021-08-31 12:02:20 A
5 2021-08-29 09:38:21 B
6 2021-08-29 09:53:06 B
7 2021-08-29 10:08:06 B
我想计算每个人的记录小时数的总和(例如,如果个人A的数据少于5小时,我会删除它)。我该怎么做?
2条答案
按热度按时间jk9hmnmh1#
lndjwyie2#
base R
方法将
timestamp
转换为类POSIXlt
(如果尚未完成)(#1)。使用aggregate()
计算每个人的时间差(以小时为单位)(#2)。最后,子集new_df
会导致每个玩具数据的空 Dataframe (#3)。