namenode的高可用性与基于zookeeper的领导者选择

vwkv1x7d  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(350)

我正在阅读apachehadoop文档和cloudera文档中的两个不同的内容。
基于cloudera,我们应该在高可用性模式下设置namenode,即:通过定义主namenode和次namenode,但是基于hadoop文档,这应该由zookeeper自动处理,它应该在可用的datanode中决定namenode。
有人能解释一下区别吗?用哪一个?

jtjikinw

jtjikinw1#

通过定义主要和次要namenode
有这样一种东西作为“次要namenode”,但它实际上是一个非常不同的东西,因为它不是一个备用的,能够成为活动的。
没有“vs”。namenode ha需要zookeeper
如果你阅读了更多的cloudera文档,它一定会提到zookeeper。
自动故障转移为hdfs部署添加了两个新组件:zookeeper仲裁和zkfailovercontroller进程(缩写为zkfc)。
cloudera并没有在hadoop核心函数之上打包太多额外的东西(如果有的话)。
关于你的问题。。。
这应该由Zookeeper自动处理
如果(手动)配置了hdfs zookeeper属性,zookeeper正在运行,并且活动namenode关闭,则故障转移是自动的。
在可用的数据节点中
该操作与datanodes无关

相关问题