标准的行业惯例是如何选择Map器和还原器的数量来完成特定的工作?假设我的s3存储桶中有10tb的原始数据,我将如何确定需要多少Map器、合并器、分区器和还原器?如果我是正确的分区器和还原器的数量是相同的,那么如何确定分配正确数量的Map器的初始障碍?数据类型是否也会影响这一点,例如csv vs xml?
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!