我是新的Pig脚本和有问题比较两个元组。
有两个文件: random
=有6个数字的序列 allposs
=有5个数字的序列
我要数一数所有的行 allposs
,文件中的序列引用 random
.
有两种可能:
顺序出现在 random
顺序出现在最后5个 random
```
A = load 'random' using PigStorage(':') as (bsid1:int, bsid2:int, bsid3:int, bsid4:int, bsid5:int, bsid6:int);
B = load 'Allposs' using PigStorage(':') as (bsid1:int, bsid2:int, bsid3:int, bsid4:int, bsid5:int);
C = FILTER A BY (A.bsid1==B.bsid1 AND A.bsid2==B.bsid2 AND
A.bsid3==B.bsid3 AND A.bsid4==B.bsid4 AND A.bsid5==B.bsid5) OR
(A.bsid2==B.bsid1 AND A.bsid3==B.bsid2 AND A.bsid4==B.bsid3 AND
A.bsid5==B.bsid4 AND A.bsid6==B.bsid5);
C = GROUP B ALL;
D = FOREACH C GENERATE COUNT(B);
DUMP D;
请帮我批改这本书。
暂无答案!
目前还没有任何答案,快来回答吧!