我试图在pig中加载以下数据(3,8,9) (4,5,6) (1,4,7) (3,7,5) (2,5,8) (9,5,8)
A = LOAD 'data' AS (t1:tuple(t1a:int, t1b:int,t1c:int),t2:tuple(t2a:int,t2b:int,t2c:int));
当转储时,只得到第一个元组,为什么另一个元组没有出现。请帮忙。
dump A;
((3,8,9),)
((1,4,7),)
((2,5,8),)
我试图在pig中加载以下数据(3,8,9) (4,5,6) (1,4,7) (3,7,5) (2,5,8) (9,5,8)
A = LOAD 'data' AS (t1:tuple(t1a:int, t1b:int,t1c:int),t2:tuple(t2a:int,t2b:int,t2c:int));
当转储时,只得到第一个元组,为什么另一个元组没有出现。请帮忙。
dump A;
((3,8,9),)
((1,4,7),)
((2,5,8),)
2条答案
按热度按时间5f0d552i1#
LOAD
默认情况下,以制表符分隔的数据。参考文献:http://pig.apache.org/docs/latest/func.html#pigstorage. 输入数据可能有空格分隔的元组,因此每行中都缺少第二个元组。nwsw7zdq2#
尝试使用
A = LOAD 'data' AS (t1:tuple(t1a:int, t1b:int,t1c:int),t2:tuple(t2a:int,t2b:int,t2c:int)) USING PigStorage(',');