如何计算mapper/reducer的数量来最大化amazon云上运行的mahout recommenderjob的性能？

yhxst69z 于 2021-06-03 发布在 Hadoop

关注(0)|答案(1)|浏览(371)

根据amazon elastic mapreduce上使用/可用的示例，计算要使用的hadoopMap器和还原器的正确数量的最佳方法是什么(使用推荐作业（mahout-core-0.7发行版）

hadoop amazon-web-services reducers Mapper mahout

来源：https://stackoverflow.com/questions/15257759/how-to-calculate-the-number-of-mappers-reducers-in-order-to-maximise-the-perform

1条答案

按热度按时间

hgc7kmma1#

一般的hadoop答案适用于：
让hadoop选择Map器的数量
将reducer的数量设置为集群中reduce插槽的数量
对于emr，请查找在您使用的示例类型上默认运行的缩减器数：http://docs.aws.amazon.com/elasticmapreduce/latest/developerguide/hadoopmemorydefault_ami2.3.html
然后乘以你使用的工人数量。这是一个相当理想的减速机数量——甚至是它的一个小倍数。
除非你有一个明确的理由认为这些不是最佳的，我还是同意这个。
ps不要忘记使用spot示例为您的员工节省资金和/或部署更多员工。
广告插播：如果你对mahout、推荐和emr感兴趣，你应该看看myrrix。我是创始人，也是你现在运行的一些mahout代码的作者。这是一个基于hadoop的“下一代”推荐产品，它已经针对emr进行了很好的优化。

赞(0）回复(0）举报 2021-06-03

我来回答

如何计算mapper/reducer的数量来最大化amazon云上运行的mahout recommenderjob的性能？

1条答案

相关问题

热门标签

最新问答