我有3列包含 start_time
, end_time
以及 tags
. 时间以历元时间格式表示,如下例所示。我想找出它们之间有1小时时差的行。
例子:
Start_time End_Time Tags
1235000081 1235000501 "Answered"
1235000081 1235000551 "Answered"
如果时间差小于一个小时,我需要获取tags列。
我想在家里做 PIG
-有人能帮忙吗?
我有3列包含 start_time
, end_time
以及 tags
. 时间以历元时间格式表示,如下例所示。我想找出它们之间有1小时时差的行。
例子:
Start_time End_Time Tags
1235000081 1235000501 "Answered"
1235000081 1235000551 "Answered"
如果时间差小于一个小时,我需要获取tags列。
我想在家里做 PIG
-有人能帮忙吗?
2条答案
按热度按时间wz3gfoph1#
如果要将日期字段保留为时间戳,解决方案如下:
最关键的一点是pig todate udf需要一个高达毫秒精度的时间戳,因此在使用这个udf之前,只需将日期字段乘以1000即可。
xwmevbvl2#
输入文件
Pig手稿
您可以根据自己的条件筛选行,如>、<==