在大型集群中，如何在转移到下一个节点之前检查kafka节点重启是否完全正常？

nfs0ujit 于 2021-06-06 发布在 Kafka

关注(0)|答案(0)|浏览(236)

有没有一个更深入的查询或终结点可以让kafka告诉我，它已经被分区覆盖了，它已经重新加入集群，它可以与所有列出的代理和zk节点进行通信，并且日志中没有java异常？
也许有一个关键的日志条目我可以找？像这样的 [GroupCoordinator ####]: Assignment received from leader for group X ? 但也有一些这样的信息。

配置

我们运行各种配置，但大多数都有这些类型的设置（带有各种调优）：

controlled.shutdown.enable=true
controlled.shutdown.max.retries=3
controlled.shutdown.retry.backup.ms=5000
default.replication.factor=3
group.max.session.timeout.ms=60000
group.min.session.timeout.ms=10000
num.partitions=5
num.replica.fetchers=4
session.timeout.ms=30000

Kafka0.10.2.1，因为很难更新我们的服务器和订户数量（超过200多个，跨越1/2打pop）。但是，如果有人能证明更新的版本有某种类型的运行状况或状态端点，或者查询服务器运行状况并调用所有分区的方法，我们将努力升级到该版本。

外部工具？

我们还经营Kafka经理以及在大多数流行音乐洞穴。也许它们有一个api，我可以查询特定节点的完整运行状况？

奖励：在复制主题下监视

也许还可以使用这些工具检查复制不足的主题/分区？如果阈值降得太低，请暂停，直到副本计数恢复，然后继续滚动重新启动。

apache-kafka yahoo-kafka-manager

来源：https://stackoverflow.com/questions/52154426/how-to-check-a-kafka-node-restart-is-completely-healthy-before-moving-onto-the-n

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

在大型集群中，如何在转移到下一个节点之前检查kafka节点重启是否完全正常？

更多细节

配置

外部工具？

奖励：在复制主题下监视

暂无答案！

相关问题

热门标签

最新问答