我采取以下措施:
A = LOAD 'a.txt' USING PigStorage('\\u001') AS (
foo:int
,bar:chararray
);
B = LOAD 'b.txt' USING PigStorage('\\u001') AS (
foo:int
,baz:long
);
C = JOIN A BY foo, B BY foo;
D = FOREACH C GENERATE
A::foo AS foo
,A::bar AS bar
,B::baz AS baz
;
如何在一个步骤中联接和定义模式?
1条答案
按热度按时间zpgglvta1#
根据文档,连接关系时不能定义模式。
注意:从语法上讲,您可以嵌套命令,使您感觉保存了以下步骤:
但我会避免这样做。这是混乱的,尽管如此,它产生了相同的解释计划作为原来的一个。