如何使用distcp备份hbase?

fdbelqdn  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(297)

我想用distcp备份hbase文件。然后将hbase指向新复制的文件并处理存储的表。
我意识到有一些工具被推荐用于这项工作。但是,我想知道在复制完文件后,我需要做些什么来让hbase识别复制的文件。
例如,我想启动hbase shell并从新复制的文件中扫描存储的表。

7kqas0il

7kqas0il1#

distcp(distributed copy)是一种用于大型集群间/集群内复制的工具。因此,如果要将clustera备份到clusterb,则必须:
使用distcp从clustera复制到clusterb
启动hbase主机和一些区域服务器
享受clusterb上的命令行界面
这意味着有两个集群,每个集群都有hdfs和hbase。
但是,如果您想在同一个群集中备份数据,这更简单:
在另一个文件夹中执行内部复制:hadoop distcphdfs://nn:8020/hbasehdfs://nn:8020/备份测试
停止所有hbase进程,并将hbase.rootdir属性从“hbase”更改为“backuptest”
重新启动所有进程

相关问题