根据spark中的小时数拆分时间戳
1,2019-04-01 04:00:21,12
1,2019-04-01 06:01:22,34
1,2019-04-01 09:21:23,10
1,2019-04-01 11:23:09,15
1,2019-04-01 12:02:10,15
1,2019-04-01 15:00:21,10
1,2019-04-01 18:00:22,10
1,2019-04-01 19:30:22,30
1,2019-04-01 20:22:30,30
1,2019-04-01 22:20:30,30
1,2019-04-01 23:59:00,10
以小时为基础,每6小时将时间戳分为4部分,然后求和。在这里,我像早上0点到6点,早上6点到晚上12点这样分开。
1,2019-04-01,12
1,2019-04-01,59
1,2019-04-01,25
1,2019-04-01,110
2条答案
按热度按时间kr98yfug1#
斯卡拉:我评论的帖子中的答案非常有效。
3zwtqj6y2#
试试这个-
加载测试数据
将日期截断为6小时,然后按groupby().sum