我要和Pig一起迈出第一步。
rawdata = load 'path' using org.apache.pig.piggybank.storage.CSVExcelStorage(',') AS (...);
由于我有一个长长的字段列表,有没有一种方法可以智能地组织它们?
我试图将字段存储在一个变量中,然后将其传递给as,但没有成功。
查看文档:https://pig.apache.org/docs/r0.11.1/basic.html#load
我还没找到解决办法,有什么想法吗?
我要和Pig一起迈出第一步。
rawdata = load 'path' using org.apache.pig.piggybank.storage.CSVExcelStorage(',') AS (...);
由于我有一个长长的字段列表,有没有一种方法可以智能地组织它们?
我试图将字段存储在一个变量中,然后将其传递给as,但没有成功。
查看文档:https://pig.apache.org/docs/r0.11.1/basic.html#load
我还没找到解决办法,有什么想法吗?
1条答案
按热度按时间laawzig21#
不能绕开它。请指定字段或使用位置符号和强制转换。
如果不在“as”之后指定数据字段,pig会自动将每个字段的数据类型默认为bytearray。然后您将必须强制转换字段。您还可以使用位置表示法(即$0、$1、$2等)访问字段。