我必须将一些hdfs文件从我的生产集群移到dev集群。在迁移到dev cluster之后,我必须根据文件修改时间测试hdfs文件上的一些操作。需要不同日期的文件在dev中进行测试。我试过使用distcp,修改时间是用当前时间更新的。我使用在distcp version2指南中找到的许多参数检查了distcp有没有其他方法可以在不改变修改时间的情况下获取文件?或者我可以在将文件放入hdfs后手动更改修改时间吗?提前谢谢
gwo2fgha1#
使用 -pt 使用 hadoop distcp 命令。这将 p 储备 t 删除的文件的imestamp(修改时间)。
-pt
hadoop distcp
p
t
hadoop distcp -pt hdfs://src_cluster/file hdfs://dest_cluster/file
用hadoop-2.7.3测试请参阅最新的distcp指南
1条答案
按热度按时间gwo2fgha1#
使用
-pt
使用hadoop distcp
命令。这将p
储备t
删除的文件的imestamp(修改时间)。用hadoop-2.7.3测试
请参阅最新的distcp指南