我正在学习hadoop框架和pig拉丁语。现在我有个问题。
我有一个数据集,格式如下:
"long a, long b, char c, char d"
现在我想用pig读取这些数据集。负载和Pig舍功能没问题。。
bla = load 'data/examples/test' as (a:long, b:long, c:chararray, d:chararray);
我的下一步是,我想比较每一行上的a和b。如果a大于b,那就好了。如果b大于a,我不想用b来切换a,这样较高的值总是我的数据集的第一个值。。。
这可能吗?在java中,我可以用一个简单的“compareto”。。。
对不起,我的英语不好:-)
1条答案
按热度按时间z9smfwbn1#
pig中的这个操作符叫做bincond。第一个说,如果
a
小于b
,然后输出b
. 第二个说,如果a
小于b
,然后输出a
. 注意,当a
大于b
,则输出相反的结果。