我想在Hive里模拟一个循环。问题是链接遍历。
原始数据:
phone,name
1234,Sam
2345,John
3456,Max
7899,Sam
7899,Tim
8899,Tim
8898,Dan
8899,John
我只对电话号码感兴趣。
如果我用1234,山姆,然后去7899,山姆,那是一跳,因为山姆也用7899。如果我从7899,sam到8899,tim是一跳,因为7899是tim用的,tim也用8899。现在我们从1234开始,到现在的8899,我们还有2跳。我可以用一个带循环的shell脚本来实现这一点,但我很感兴趣的是,这是否完全可以在hive中实现。如果满足任何一个条件,我希望循环停止:
达到10跳或未检测到新的数字
(如果上述条件很难实现,我只需要一个条件——达到10跳)
视觉表现:
1 hop:
1234 -> Sam
Sam linked to 7899
2 hops:
7899 -> Tim
Tim linked to 8899
所以1234和8899是两个跳。
欢迎任何提示!
暂无答案!
目前还没有任何答案,快来回答吧!