hbase mapreduce,多表操作

mepcadol  于 2021-06-04  发布在  Hadoop
关注(0)|答案(1)|浏览(420)

有两个hbase表(table1,table2)作为输入源,使用mapreduce将table1中的一列与table2中的一列进行比较,如果table1中的一列与table2中的一列等价,则输出到table3。
如何使用mapreduce解决这个问题(hadoop2.2.0+hbase0.96.0版)

lfapxunr

lfapxunr1#

第一步-通过此链接了解如何将hbase表作为Map器的源:hbase table as mapper source
下一步是解决您的具体问题:您将有2个Map器(即2个输入),每个表对应一个Map器。根据表中的值进行减少。您可能需要一个复杂的键或值中的某些内容来指定哪个表值来自reducer。在reducer中,如果值/键来自两个表(即两个Map器),则可以使用hbase api(上面的链接也解释了其中的bot)写入表。

相关问题