我正在使用distcp将数据从集群1复制到集群2。我成功地将表数据从集群1复制到集群2中。但是,使用hdfs,数据已发送到文件浏览器。
有没有直接的方法可以使用distcp命令将这个hdfs数据转换成一个配置单元表(包括数据类型、delimeters…等等)?我当然可以查询它来收集来自hdfs的数据,但是我必须一个接一个地转换它们。努力寻找有效的方法。谢谢!
例子:
hadoop distcp hdfs://nn1:8020/source/a hdfs://nn1:8020/source/b hdfs://nn2:8020/destination
1条答案
按热度按时间muk1a3rh1#
还没有找到可以直接使用distcp复制表的文档。但是,如果有人正在寻找类似的情况,他们可以使用。为我工作。