hbase需要从一个集群导出数据,然后将数据导入到另一个集群,只需对行键稍加修改

xzv2uavs  于 2021-05-31  发布在  Hadoop
关注(0)|答案(0)|浏览(236)

我正在尝试从hbase表“mytable”中导出数据,该表的行键以“”开头。

scan 'mytable', {ROWPREFIXFILTER => 'abc'}

以上导出的数据需要通过将rowkey前缀从“”更改为“def”导入到另一个集群中
旧数据:

hbase(main):002:0> scan 'mytable', {ROWPREFIXFILTER => 'abc'}
ROW               COLUMN+CELL                                                                                                                                
abc-6535523   column=track:aid, timestamp=1339121507633, value=some stream/pojos

新数据:(在另一个群集中)

hbase(main):002:0> get 'mytable', 'def-6535523'
    ROW               COLUMN+CELL                                                                                                                                
    def-6535523   column=track:aid, timestamp=1339121507633, value=some stream/pojos

只需要修改部分行键。其他数据需要相同。
试图使用 bin/hbase org.apache.hadoop.hbase.mapreduce.Export table_name file:///tmp/db_dump/ 在导出中,没有指定起始行和结束行的规定。
但不知道如何用更改的rowkey导入它。
另外,hbase/hadoop中是否有任何内置软件可供使用
请帮忙。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题