dmlxxgboost作业在随后提交时处于“接受”状态

w1jd8yoj 于 2021-05-29 发布在 Hadoop

关注(0)|答案(0)|浏览(318)

我在aws中有一个3节点集群（1个主节点和2个从节点）
配置：
主机（8 vcpu，16 gb）
从属1（4个vcpu，8 gb）
从属1（4个vcpu，8 gb）
当我提交dmlcxgboost作业以使其按预期运行时，如果我在5分钟内再次提交相同的作业，它将被卡住。如果作业提交在连续6分钟左右，它的工作完全正常。
我试着查了一下卡住的原因，上面写着下面这样的话
[sun jun 09:03:53+0000 2019]应用程序已添加到计划程序，尚未激活。已超出队列am资源限制。详细信息：am分区=；am资源请求=；am=的队列资源限制；队列的用户am资源限制=；队列am资源使用率=；
看了网上所有的线后，他试图修改Yarn参数，但还没有得到任何运气。
下面是我目前使用的配置。
capacity-scheduler.xml文件
Yarn.调度器.容量.最大应用：10000
yarn.scheduler.capacity.maximum-am-resource-percent:0.9
yarn.scheduler.capacity.resource-calculator:org.apache.hadoop.yarn.util.resource.defaultresourcecalculator
yarn.scheduler.capacity.root.queues:默认值
yarn-site.xml文件
yarn.acl.enable:0
yarn.resourcemanager.hostname:节点主节点
yarn.nodemanager.aux-services:mapreduce\u shuffle
yarn.nodemanager.resource.memory-mb:4608
yarn.scheduler.maximum-allocation-mb:4608
yarn.scheduler.minimum-allocation-mb:1536
yarn.nodemanager.vmem-check-enabled:假
yarn.app.mapreduce.am.resource.mb:3072
mapred-site.xml文件
mapreduce.framework.name:Yarn
yarn.app.mapreduce.am.resource.mb:1536个
mapreduce.map.memory.mb:1536
mapreduce.reduce.memory.mb:3072
任何帮助都将不胜感激。

hadoop yarn amazon-web-services xgboost

来源：https://stackoverflow.com/questions/56525495/dmlx-xgboost-job-stuck-in-yarn-in-accepted-state-when-submitted-subsequently

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

dmlxxgboost作业在随后提交时处于“接受”状态

暂无答案！

相关问题

热门标签

最新问答