hadoop—如何通过保留修改时间将hdfs文件从一个集群复制到另一个集群

2j4z5cfb  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(407)

我必须将一些hdfs文件从我的生产集群移到dev集群。在迁移到dev cluster之后,我必须根据文件修改时间测试hdfs文件上的一些操作。需要不同日期的文件在dev中进行测试。
我试过使用distcp,修改时间是用当前时间更新的。我使用在distcp version2指南中找到的许多参数检查了distcp
有没有其他方法可以在不改变修改时间的情况下获取文件?或者我可以在将文件放入hdfs后手动更改修改时间吗?
提前谢谢

gwo2fgha

gwo2fgha1#

使用 -pt 使用 hadoop distcp 命令。这将 p 储备 t 删除的文件的imestamp(修改时间)。

hadoop distcp -pt hdfs://src_cluster/file hdfs://dest_cluster/file

用hadoop-2.7.3测试
请参阅最新的distcp指南

相关问题