如何将输入拆分存储在hadoop集群上

r6hnlfcb  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(415)

例如,我们有一个由4台机器组成的集群。我们想存储一个被分成6个输入区的文件。现在我的问题是这6个输入拆分将如何存储在由4台机器组成的集群上?

qni6mghb

qni6mghb1#

阐明分裂是逻辑上的划分。区块是物理分区。当一个文件上传到hdfs时,根据您的blocksize设置64mb(默认值),该文件被分为多个块。
根据您的复制因子,数据将根据默认的块放置策略分布在数据节点之间。
希望这能澄清。。

相关问题