嗨,我使用HDFS,但有趣的是,我发现我的父目录的大小大于其子目录的总大小。这对我来说很奇怪。有人知道为什么吗?谢谢!请看以下cli:
user@machine-cli-001:~$ hdfs dfs -du -h -s /apps/xxx/yyy/zzz/20230625
10.9 G /apps/xxx/yyy/zzz/20230625
user@machine-cli-001:~$ hdfs dfs -du -h -s /apps/xxx/yyy/zzz/20230625/*
4.8 G /apps/xxx/yyy/zzz/20230625/regular_data_folder
631.8 M /apps/xxx/yyy/zzz/20230625/special_data_folder
字符串
如您所见,4.8G + 631.8M < 10.9G。我不是一个Hadoop集群维护者,而只是一个用户。所以可能是管理团队在幕后做了一些事情。不过,我想确保我没有搞砸我的事情。
1条答案
按热度按时间jucafojl1#
您可以kook this来查找
-du
和-count
以及-x
选项之间的差异顺便说一下,你可以使用
hdfs dfs -count -h