我需要一些帮助如何达到在Pig,在某一领域只有一个记录是采取。
A = load .... ;
/*数据如下:
事务id、产品id、日期
1, 123, 20140102
1, 124, 20140102
1, 125, 20140102
2, 233, 20140107
2, 245, 20140107
3, 255, 20140109 */
B = GROUP A BY transaction_id;
C = FOREACH B {
limited = LIMIT A 1;
GENERATE FLATTEN(limited);
};
我希望它返回3条记录,但只返回1条记录。
我做错了什么?
谢谢你提前回复。
1条答案
按热度按时间kqhtkvqz1#
我发现了问题。不好意思,但我忘了在加载时更改字段分隔符,这就是为什么它只返回一个记录