zooker故障转移策略

new9mtju  于 2021-06-07  发布在  Kafka
关注(0)|答案(1)|浏览(376)

我们是一个年轻的团队,正在使用storm和kafka构建一个应用程序。我们有共同的zookeeper合奏的3个节点,这是由风暴和Kafka使用。
我写了一个测试用例来测试zooker的故障转移
1) 检查所有三个节点都在运行,并确认其中一个节点被选为领导者。
2) 使用zookeeper unix客户机,创建znode并设置一个值。验证值是否反映在其他节点上。
3) 修改znode。在一个节点中设置值,并验证其他节点是否反映了更改。
4) 杀死一个工作节点,并确保主节点/主节点收到崩溃通知。
5) 杀死领头节点。验证出另外两个节点,一个被选为领导者。
我需要添加更多的测试用例吗?要添加的其他想法/建议/指针?

nnt7mjpx

nnt7mjpx1#

从文档中
验证自动故障转移
设置自动故障转移后,应测试其操作。为此,首先找到活动namenode。您可以通过访问namenode web界面来判断哪个节点处于活动状态——每个节点在页面顶部报告其ha状态。
找到活动namenode后,可能会导致该节点出现故障。例如,可以使用kill-9来模拟jvm崩溃。或者,你可以关闭机器的电源或者拔掉它的网络接口来模拟一种不同的中断。触发要测试的中断后,另一个namenode应在几秒钟内自动变为活动状态。检测故障和触发故障转移所需的时间取决于ha.zookeeper.session-timeout.ms的配置,但默认为5秒。
如果测试不成功,可能是配置错误。检查zkfc守护程序和namenode守护程序的日志,以便进一步诊断问题。
有关设置自动故障切换的详细信息

相关问题