Zookeeper Apache Drill -无法在分布式模式下启动Drill(在GCP Dataproc中)

mwg9r5ms  于 2023-05-27  发布在  Apache
关注(0)|答案(1)|浏览(215)

我尝试在Google Cloud Dataproc上以分布式模式运行Apache Drill,但无法在集群中的每个节点上启动drillbit。
我使用Apache Drill网站上提供的初始化脚本和说明创建了一个带有GCP Dataproc服务的基本集群(1个主集群,2个工作集群)。
Installing Drill in Distributed Mode in Dataproc
Apache Drill 1.19.0和Apache Zookeeper 3.6.3版本已在安装脚本中配置。Dataproc中的群集配置是成功的,我能够使用SSH连接每个节点。当我尝试使用telnet localhost 2181并输入stats来检查Zookeeper的状态时,它显示以下内容
Zookeeper Status
然后,我尝试使用命令bin/drillbit.sh start在每个节点上启动钻头服务,如这里提到的Starting Drill in Distributed Mode
然后它显示
启动钻头,登录到/opt/drill/log/drillbit.out
当我使用bin/drillbit.sh status检查钻取状态时,它显示
/opt/drill/drillbit.pid文件存在,但钻头未运行。
请提供有关如何解决此问题并在分布式模式下设置Apache Drill的帮助。

7hiiyaii

7hiiyaii1#

我不知道Dataproc,但你正在使用的贡献脚本,特别是automation.sh和apache-drill.sh,已经包含了启动ZooKeeper和Drill的命令。所以你不应该使用drillbit.sh来自己启动Drillbits。您可以通过转到位于http://:8047的Web UI来检查Drill是否正在运行。请注意,Drill集群中没有主节点,您可以在Web UI URL中使用任何一个Drillbit。
脚注:Drill在1.19之后有了一点改进,所以你可以尝试在apache-drill.sh的第10行做如下修改。

readonly DRILL_VERSION='1.21.1'

相关问题