如何用多个分隔符将文件加载到pig中?

crcmnpdw  于 2021-06-24  发布在  Pig
关注(0)|答案(1)|浏览(441)

我有以下文件 tax_cal 我想装Pig:
101,5|2;3|2
102,3|1;4.5|2;4|1
103,2|1;5|2;5.6|3
输出:
101,5|2,3|2
102,3|1,4.5|2,4|1
103,2|1,5|2,5.6|3
此外,我将把这个输出文件传递给python udf来计算totalprice。
我怎样才能做到这一点?

dffbzjpn

dffbzjpn1#

因此,pig的基本加载命令如下所示,但我不确定您的文件示例数据类型。试着看看下面这个,检查一下你是否可以按你需要的方式修改它。

A = LOAD '(your_file_name)' USING PigStorage(',') AS (bill_number:INT, tax:chararray);

相关问题