我们正在处理timeseries数据,需要基于timeseries值创建基于时间的事件。
下面是示例输入配置单元表。
PointId Timestamp Value
P1 1/1/2017 0:03 3
P1 1/1/2017 0:09 3
P1 1/1/2017 0:38 3
P2 1/1/2017 0:01 5
P2 1/1/2017 0:05 5
P2 1/1/2017 0:27 21
P2 1/1/2017 0:33 5
我想根据时间戳创建事件。输出应该是这样的
PointId Start Event End Event Value
P1 1/1/2017 0:03 1/1/2017 0:38 3
P2 1/1/2017 0:01 1/1/2017 0:05 5
P2 1/1/2017 0:05 1/1/2017 0:27 21
P2 1/1/2017 0:27 1/1/2017 0:33 5
我可以使用hive、spark core和sparksql来实现。提前谢谢。
暂无答案!
目前还没有任何答案,快来回答吧!