如何删除pig中的重复列?

yhived7q  于 2021-06-25  发布在  Pig
关注(0)|答案(1)|浏览(384)

我有一张员工桌

eid | ename  | deptno
---------------------
1   | ABC    | 10
2   | XYZ    | 20 
3   | PQR    | 10 
4   | BCD    | 20 
5   | CBA    | 10

当我尝试使用deptno进行分组时,它在第二列中也显示deptno。如何避免它?

vnzz0bqm

vnzz0bqm1#

一旦分组,就必须遍历元素(使用 FOREACH )并用 GENERATE 选择您感兴趣的列。比如:

res = FOREACH ( GROUP input BY deptno ) {
    GENERATE eid, ename
        , deptno -- you may remove that line if you do not need deptno anymore
    ;
}

相关问题