hdfs:集群上所有磁盘的实际空间与可用hdfs大小

xoefb8l8  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(398)

如何根据集群中磁盘的总大小计算hdfs集群的可用大小?
e、 g.如果我的集群是10台机器,每台机器有1tb的存储空间,那会是什么 hadoop fs -df 报告?
更具体地说,我需要在hdfs集群中存储5tb的数据。我的群集总共需要多少磁盘空间?

7cjasjjr

7cjasjjr1#

这完全取决于如何设置hdfs复制因子。默认值(推荐值)为3。
您还可以设置hdfs来保留一些非dfs空间,因此,如果需要,可以减去它。
粗略的计算几乎总是正确的 file size * 3 = total storage needed .

相关问题