如何选择Map器和还原器计数?

iecba09b  于 2021-07-13  发布在  Hadoop
关注(0)|答案(0)|浏览(245)

标准的行业惯例是如何选择Map器和还原器的数量来完成特定的工作?
假设我的s3存储桶中有10tb的原始数据,我将如何确定需要多少Map器、合并器、分区器和还原器?
如果我是正确的分区器和还原器的数量是相同的,那么如何确定分配正确数量的Map器的初始障碍?数据类型是否也会影响这一点,例如csv vs xml?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题