在实现时提供的解决方案是如何用pig拉丁语优化groupby语句?我发现所有有一个空列的行都会被删除,这是pig的预期行为。我想知道下面的代码是否可以工作?
A = B join by ( Bcol1 is null?'UNK',Bcol2 is null?'UNK',Bcol2 is null?999),
C join by ( Ccol1 is null?'UNK',Ccol2 is null?'UNK',Ccol2 is null?999)
我得到一些解析错误。
在实现时提供的解决方案是如何用pig拉丁语优化groupby语句?我发现所有有一个空列的行都会被删除,这是pig的预期行为。我想知道下面的代码是否可以工作?
A = B join by ( Bcol1 is null?'UNK',Bcol2 is null?'UNK',Bcol2 is null?999),
C join by ( Ccol1 is null?'UNK',Ccol2 is null?'UNK',Ccol2 is null?999)
我得到一些解析错误。
1条答案
按热度按时间9udxz4iz1#
pig是一种数据流脚本语言,添加额外的foreach generate修复空值不会导致额外的map reduce作业。