异构集群中的hadoop mapreduce2优化

6l7fqoea 于 2021-05-29 发布在 Hadoop

关注(0)|答案(1)|浏览(364)

我有以下配置：
hadoop:v2.7.1（Yarn）
输入文件：大小=100 gb。
3个从机：每个从机有4个vCore，速度=2 ghz，ram=8 gb
5个从机：每个从机有2个vCore，速度为1GHz，ram为2GB
mapreduce程序：wordcount
如何通过将小的输入分割分配给5个较慢的从机，将大的输入分割分配给3个最快的从机来最小化字数执行时间？

hadoop mapreduce optimization

来源：https://stackoverflow.com/questions/34829107/hadoop-mapreduce2-optimization-in-heterogeneous-cluster

1条答案

按热度按时间

对于每台机器，您可以确定map/reduce插槽的数量，因此如果您希望向较慢的机器发送较少的工作负载，您可以为每台较慢的机器定义2个map/reduce任务插槽，为每台较快的机器定义4个map/reduce任务插槽。通过这种方式，您可以控制集群中每个不同节点接收的工作负载。

赞(0）回复(0）举报 2021-05-30

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 3个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 3个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 3个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 3个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 3个月前