比较pig中两个文件的元组

9udxz4iz  于 2021-06-21  发布在  Pig
关注(0)|答案(1)|浏览(343)

我想用pig比较两个不同文件中的元组。如果元组是彼此的镜像,我希望将该元组放入file-f3。
如果f1有以下元组

(1 2)
(3 4)

f2有以下元组

(5 6)
(4 3)

因为(34)是(43)的镜像,所以我们需要将这个值存储在f3中。因此,f3将是

(3 4)
qeeaahzv

qeeaahzv1#

您只需将两个数据集进行内部联接,如下所示:

data1 = LOAD '$data1' USING AvroStorage();
data2 = LOAD '$data2' USING AvroStorage();

output = JOIN data1 BY ($0, $1), data2 BY ($1, $0);
output2 = FOREACH output GENERATE data1.$0, data1.$1;

相关问题