我使用1 master
和1 core node
调配了一个AWS EMR HBASE
群集(m5.xLarge)。我的群集没有任何“任务”节点,因为我计划将此群集仅用于存储。两个框上的hdfs-site.xml
文件都将dfs.replication
设置为1,这是有意义的。然后我手动添加了5个core
节点。我希望EMR能按照他们的文档-https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-hdfs-config.html将复制因子从1提高到2
据我所知,如果我在引导过程中提供6个核心,EMR会将复制因子设置为2,但在我的使用案例中,如果我在启动并运行后手动扩展集群,情况会怎样呢?
1条答案
按热度按时间f5emj3cl1#
EMR似乎不会自动执行此操作。在向上扩展群集后,我需要通过手动重新配置示例组-https://docs.aws.amazon.com/emr/latest/ReleaseGuide/emr-configure-apps-running-cluster.html来重新配置复制因子