分布式系统中的Kafka

olmpazwi  于 2021-06-08  发布在  Kafka
关注(0)|答案(2)|浏览(305)

我是新来Kafka,我运行Kafka在一台机器到现在为止。我想在多台机器上的分布式环境中运行kafka。对此没有适当的文档。任何关于这方面的文件或建议都会非常有用。

tp5buhyn

tp5buhyn1#

基本上你需要做以下工作
1) 在所有机器上安装Kafka
2) 配置 config/server1.properties 属性文件以指定唯一的 id 对于每台机器。你可以通过设置 broker.id 配置文件中的属性。例如。 broker.id=1 , broker.id=2 . 对于每个代理,此id都应该是唯一的。这就是kafka集群中每个节点的标识方式。
3) 在所有节点中启动Kafka
您可以参考第6步:从官方的快速入门页面设置多代理集群。
这里还有一篇很好的文章值得一看

ngynwnxp

ngynwnxp2#

添加到用户2720864之前的答案
假设Kafka系统需要以下配置。
7Kafka节点
3名Zookeeper
要实现这一点,请在7个不同的服务器/vm(instances)中安装7个kafka示例,并在每个示例中设置不同的代理id,这将让zookeeper识别不同的kafka节点以进行记账、维护。broker.id=x(/config/server.properties)
要启动zookeepers,可以使用3个以前的kafka示例,也可以使用新服务器启动zookeepers。一旦决定了zookeers运行的服务器,就可以更改/config/server.properties来指定zookeers。
zookeeper.connect=hostname1:port1,hostname2:port2
在分布式环境中,有3个Zookeeper是件好事。当只有一个管理员是真正的主人时,另外两个管理员是故障转移者。当主控失败时,两个ZK中的一个将接管主控。
我发现这个链接非常有用,它帮助我澄清了很多关于Kafka建筑的事情。
这对于kafka中所有属性文件的配置都是一个很好的参考。
希望这有帮助!

相关问题