我有两份档案
文件1
id,sal,location,code
1000,1000,jupiter,F
1001,2000,jupiter,F
1002,3000,jupiter,F
1003,4000,jupiter,F
1004,5000,jupiter,F
文件2
id,sal,location,code
1000,2000,jupiter,F
1001,2000,jupiter,Z
1002,3000,jupiter,F
1003,4000,jupiter,F
1004,5000,jupiter,F
当我比较文件1和文件2时,我需要一个如下的输出
1000, sal
1001,code
基本上,它应该告诉我什么领域是改变了从以前的文件随着id。这可以在Pig。
1条答案
按热度按时间9gm1akwq1#
您可以很容易地解决这个问题,但最具挑战性的部分将是您提到的输出格式。它需要一点复杂的逻辑来获得输出格式。
我已经修复了大多数的边缘情况,但你可以检查你的输入,以确保它适用于所有的组合。
文件1:
文件2:
Pig手稿:
输出: