我想用pig比较两个不同文件中的元组。如果元组是彼此的镜像,我希望将该元组放入file-f3。如果f1有以下元组
(1 2) (3 4)
f2有以下元组
(5 6) (4 3)
因为(34)是(43)的镜像,所以我们需要将这个值存储在f3中。因此,f3将是
(3 4)
qeeaahzv1#
您只需将两个数据集进行内部联接,如下所示:
data1 = LOAD '$data1' USING AvroStorage(); data2 = LOAD '$data2' USING AvroStorage(); output = JOIN data1 BY ($0, $1), data2 BY ($1, $0); output2 = FOREACH output GENERATE data1.$0, data1.$1;
1条答案
按热度按时间qeeaahzv1#
您只需将两个数据集进行内部联接,如下所示: