监视和验证长distcp操作

35g0bw71  于 2021-06-01  发布在  Hadoop
关注(0)|答案(1)|浏览(266)

除了检查yarn/mapreduce日志之外,是否还有其他方法可以监视和验证大型hadoop distcp、集群到集群、hdfs拷贝作业(数百万个大小文件,运行时估计:几天,由于虚拟化环境和群集的并行生产使用而改变网络速度)
在hdp2.6.1上使用distcpv2和apachehadoop2.7.3

rqcrx0a6

rqcrx0a61#

在distcp命令中使用以下参数将复制状态写入日志:

-log <logdir>

将日志写入distcp将它尝试复制的每个文件的日志作为Map输出保存。如果Map失败,则如果重新执行,则不会保留日志输出。

相关问题