pig:按上一个表结果筛选配置单元表

7uhlpewt  于 2021-05-31  发布在  Hadoop
关注(0)|答案(1)|浏览(238)

我需要查询一个配置单元表,并用上一个配置单元表的一列筛选另一个配置单元表。
例子:

A = LOAD 'db.table1' USING org.apache.hive.hcatalog.pig.HCatLoader();

filterA = filter A by (id=='123');

B = LOAD 'db.table2' USING org.apache.hive.hcatalog.pig.HCatLoader();

//the problem is here. filterA has many rows. I need to apply filter for each of the row.

filterB = filter B by (id==filterA.id);

a中的数据:
tabid部门位置
1是sj
2 4立方英尺
3.5欧共体md
b中的数据:
选项卡id名称地址
约翰大街123号14号
2 5 jane 456 n大道
3 9尼克789大湖
预期结果:
选项卡id名称地址
约翰大街123号14号
2 5 jane 456 n大道

rryofs0p

rryofs0p1#

如评论中所问,听起来你想要的是加入。对不起,如果我误解了你的问题。

A = LOAD 'db.table1' USING org.apache.hive.hcatalog.pig.HCatLoader();
B = LOAD 'db.table2' USING org.apache.hive.hcatalog.pig.HCatLoader();
C = JOIN A by id, B by id;

相关问题