哪个是pigstorage()需要用来获取用于以下查询的加载文件
INSERT OVERWRITE DIRECTORY 'doop'
select a.* from cdr.cell_tower_info
上述查询的输出如下 Haryana Ambala 404 20 80 37591 76.76746 30.373488 404-20-80-37591 Haryana Ambala 404 20 80 30021 76.76746 30.373488 404-20-80-30021 Haryana Ambala 404 20 80 37591 76.76746 30.373488 404-20-80-37591
我正在使用cdr analysis,首先我需要使用select从表中检索一些字段并将其保存到hdfs文件夹中,这个结果再次需要使用pig加载以进行进一步分析
4条答案
按热度按时间oaxa6hgo1#
如果数据存储在配置单元表中,
我的端口是9000。按你的制度给。
bbuxkriu2#
配置单元的默认分隔符是ctrl-a(\001)。
我认为pig存储('\001')应该可以使用pig中的配置单元输出数据。
或者,可以将配置单元表定义为以'\t'结尾的字段,以便结果可以直接在pig中使用。
xtfmy6hx3#
试试这个
qnakjoqk4#
你能试试这个吗?
输入文件
Pig手稿:
输出: