例如,我们有一个由4台机器组成的集群。我们想存储一个被分成6个输入区的文件。现在我的问题是这6个输入拆分将如何存储在由4台机器组成的集群上?
qni6mghb1#
阐明分裂是逻辑上的划分。区块是物理分区。当一个文件上传到hdfs时,根据您的blocksize设置64mb(默认值),该文件被分为多个块。根据您的复制因子,数据将根据默认的块放置策略分布在数据节点之间。希望这能澄清。。
1条答案
按热度按时间qni6mghb1#
阐明分裂是逻辑上的划分。区块是物理分区。当一个文件上传到hdfs时,根据您的blocksize设置64mb(默认值),该文件被分为多个块。
根据您的复制因子,数据将根据默认的块放置策略分布在数据节点之间。
希望这能澄清。。