amazon弹性mapreduce中的hadoop容量调度器

ffscu2ro 于 2021-05-30 发布在 Hadoop

关注(0)|答案(1)|浏览(307)

我是全新的亚马逊弹性mapreduce。我有一个需求，我想使用我的定制调度器，它是基于hadoop容量调度器实现的，来调度amazonelasticmapreduce中的作业。
根据我目前的理解，要实现这一点，我只能在作业流中定义一个阶段，并通过ssh连接将我的自定义jar文件提交到主节点。但是，我找不到如何编辑xml配置文件，如主节点中的capacity-scheduler.xml。有人知道怎么做吗？
此外，如果我想在其上添加动态调整大小属性，那么当作业当前正在运行时，是否可以动态调整集群中任务节点的数量？或者在每个阶段，集群的大小应该保持不变？非常感谢。

hadoop amazon-emr scheduler dynamic-sizing

来源：https://stackoverflow.com/questions/25550492/capacity-scheduler-in-amazon-elastic-mapreduce

1条答案

按热度按时间

prdp8dxp1#

您应该使用引导操作来更改hadoop配置。
以下aws文档可用于hadoop配置引导操作。
http://docs.aws.amazon.com/elasticmapreduce/latest/developerguide/emr-plan-bootstrap.html#predefinedbootstrapactions_configurehadoop
我的这篇博客文章也有一些信息。http://sujee.net/tech/articles/hadoop/amazon-emr-beyond-basics/
要动态更改集群大小，一个选项是使用awssdk。
http://docs.aws.amazon.com/elasticmapreduce/latest/developerguide/calling-emr-with-java-sdk.html
使用以下界面可以修改示例组的示例数。http://docs.aws.amazon.com/awsjavasdk/latest/javadoc/com/amazonaws/services/elasticmapreduce/amazonelasticmapreduce.html

赞(0）回复(0）举报 2021-05-30

我来回答

amazon弹性mapreduce中的hadoop容量调度器

1条答案

相关问题

热门标签

最新问答