hadoop pig自定义密钥名称

hts6caw3  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(270)

例如,我有这样一个输入文件:

xxx,14
yyy,20
zzz,11

我想对第二个字段和输出求和。现在我知道如何使用hadoop pig对其求和,但我希望输出如下:

Canada,45

所以这意味着我自己把键名设为“canada”,然后加上和作为值。我如何自己设置密钥名称?

jchrr9hc

jchrr9hc1#

只需应用一个常量字段:

A = load 'data.txt' using PigStorage(',') as (txt:chararray, num:int);
B = group A ALL;
C = foreach B generate 'Canada' as country:chararray, SUM(A.num) as total:int;

相关问题