我有数据在里面 csv
用列格式化 "movie name", price
我的产量应该低于
5 : 5200
5-10 : 500
10-15 : 5140
等等
我试过下面的代码
A = LOAD '/root/pig-0.13.0/scripts/dvd_data/dvd_csv.txt' using PigStorage(',');
B = foeach A generate REPLACE($0, '\\"', ''),$2,$6
我无法确定获得所需输出的逻辑。我正在寻找一些帮助来获得它。
1条答案
按热度按时间velaa5lx1#
如果用例是在一组固定的价格桶(lt5、gt5到lt10、gt10到lt15)下获取电影的数量,等等。。然后我们可以利用bincond算子。
Pig脚本:
示例输入:a.csv:
输出:转储d: