我想用distcp备份hbase文件。然后将hbase指向新复制的文件并处理存储的表。我意识到有一些工具被推荐用于这项工作。但是,我想知道在复制完文件后,我需要做些什么来让hbase识别复制的文件。例如,我想启动hbase shell并从新复制的文件中扫描存储的表。
7kqas0il1#
distcp(distributed copy)是一种用于大型集群间/集群内复制的工具。因此,如果要将clustera备份到clusterb,则必须:使用distcp从clustera复制到clusterb启动hbase主机和一些区域服务器享受clusterb上的命令行界面这意味着有两个集群,每个集群都有hdfs和hbase。但是,如果您想在同一个群集中备份数据,这更简单:在另一个文件夹中执行内部复制:hadoop distcphdfs://nn:8020/hbasehdfs://nn:8020/备份测试停止所有hbase进程,并将hbase.rootdir属性从“hbase”更改为“backuptest”重新启动所有进程
1条答案
按热度按时间7kqas0il1#
distcp(distributed copy)是一种用于大型集群间/集群内复制的工具。因此,如果要将clustera备份到clusterb,则必须:
使用distcp从clustera复制到clusterb
启动hbase主机和一些区域服务器
享受clusterb上的命令行界面
这意味着有两个集群,每个集群都有hdfs和hbase。
但是,如果您想在同一个群集中备份数据,这更简单:
在另一个文件夹中执行内部复制:hadoop distcphdfs://nn:8020/hbasehdfs://nn:8020/备份测试
停止所有hbase进程,并将hbase.rootdir属性从“hbase”更改为“backuptest”
重新启动所有进程