我正在尝试用pig拉丁语编写一个通用脚本,需要根据最后一列过滤数据。我的数据集将有不同的列计数,我将根据最后一列进行过滤。有什么办法我们能得到Pig的最后一栏吗。
master = LOAD '/user/data/usps/dataset_1/' using PigStorage(',') ; B = FILTER master BY last_column is null;
g6ll5ycj1#
你不能使用pig存储。但您可以编写自己的自定义加载程序(老实说很容易)来解析数据并将最后一列命名为“last\u column”
1条答案
按热度按时间g6ll5ycj1#
你不能使用pig存储。但您可以编写自己的自定义加载程序(老实说很容易)来解析数据并将最后一列命名为“last\u column”