我从一个csv文件中读取数据,然后对这些数据进行分组,然后进行计数操作。如果计数为0,有没有办法将数据存储到一个文件夹名中?如果计数大于0,有没有办法将数据存储到一个文件夹名中。我尝试了下面的代码,但它没有发生。
CODE : STORE countVal INTO '/user/cloudera/good' IF countVal > 0 ;
nlejzf6q1#
使用函数拆分。参考:https://pig.apache.org/docs/r0.7.0/piglatin_ref2.html#split
SPLIT A INTO X IF f1<7, Y IF f2==5, Z IF (f3<6 OR f3>6);
sr4lhrrt2#
有两种方法:1) 使用split函数根据条件执行拆分。如果计数大于0,则将数据拆分为好数据;如果计数==0,则将数据拆分为坏数据;2) 使用foreach循环,使用bincond操作符,根据条件分离数据。x=foreach a generate,data,(count>0?“good”:“bad”);
2条答案
按热度按时间nlejzf6q1#
使用函数拆分。参考:
https://pig.apache.org/docs/r0.7.0/piglatin_ref2.html#split
sr4lhrrt2#
有两种方法:
1) 使用split函数根据条件执行拆分。
如果计数大于0,则将数据拆分为好数据;如果计数==0,则将数据拆分为坏数据;
2) 使用foreach循环,使用bincond操作符,根据条件分离数据。
x=foreach a generate,data,(count>0?“good”:“bad”);