我正在尝试用pig拉丁语脚本加载数据文件,数据有2列,但第2列中有一个文本限定符,示例数据如下:
DEVICE_ID,SUPPORTED_TECH
a2334,"GSM900,GSM1500,GSM200"
a54623,"GSM900,GSM1500"
a86646,"GSM1500,GSM200"
当我尝试按如下方式加载日期时,第2列不被识别为1列
deviceList = load 'deviceList.csv' Using PigStorage(',') as (DEVICE_ID:chararray, SUPPORTED_TECH:chararray );
加载数据集时如何定义文本限定符?
1条答案
按热度按时间guicsvcw1#
试试这个,如果你需要不同的输出格式请告诉我
输入文件
Pig手稿:
输出: