hadoop Map减少中间输出

sauutmhj  于 2022-11-01  发布在  Hadoop
关注(0)|答案(1)|浏览(282)

我指的是map-reduce的博客,它强调把中间结果写到磁盘上。这里我的问题是为什么map-reduce把中间结果写到磁盘上,不能只使用内存(RAM)吗?是不是有什么问题需要这种方法?非常感谢你的回答

sr4lhrrt

sr4lhrrt1#

由于Hadoop MapReduce旨在用于在商用硬件上并行处理数TB的数据集[1],因此将中间结果存储在RAM中通常是不可行的,因为大多数商用硬件几乎没有足够的RAM可用于此目的。因此,必须使用磁盘存储来存储中间结果以供进一步处理。

相关问题