REGISTER piggybank.jar;
DEFINE CSVLoader org.apache.pig.piggybank.storage.CSVLoader();
A = LOAD 'test1.txt' USING CSVLoader(',') AS (f1:int,f2:int,f3:chararray,f4:chararray,f5:int);
B = FOREACH A GENERATE f1,f2,f3,f4,f5;
DUMP B;
另一种选择是将数据加载到一行中,然后使用strsplit
A = LOAD 'test1.txt' USING TextLoader() AS (line:chararray);
B = FOREACH A GENERATE FLATTEN(STRSPLIT(line, '","'));
DUMP B;
1条答案
按热度按时间daolsyd01#
pigstorage使用单个字符作为分隔符。您将使用piggybank的内置函数。下载piggybank.jar并保存在与pigscript相同的文件夹中。在pigscript中注册jar。
另一种选择是将数据加载到一行中,然后使用strsplit