如何让齐柏林飞艇在emr集群上干净地重新启动?

8zzbczxx  于 2021-06-02  发布在  Hadoop
关注(0)|答案(5)|浏览(521)

我正在运行一个电子病历集群,并试图使用齐柏林飞艇笔记本进行数据分析。
版本:发布label:emr-5.2.1
hadoop发行版:amazon 2.7.3
Hive2.1.0
Spark2.0.2
齐柏林飞艇0.6.2
我一直有问题,齐柏林飞艇挂了,而运行一个查询,我永远无法恢复它。我试过:
-重新启动解释器
-ssh'ing进入主节点并运行 zeppelin_daemon.sh restart (已经试过以hadoop/root/zeppelin的身份运行,也试过使用选项运行脚本 reload , start/stop , upstart )
每次我使用守护程序shell脚本时,它都会告诉我它已经停止/启动了,但是当我运行一个状态时,我会得到以下结果: Zeppelin running but process is dead [FAILED] 我唯一能做的似乎就是杀死我的集群并建立一个新的集群,这在很多层面上都是疯狂的。
那么…官方支持的重启齐柏林飞艇的方式是什么???

syqv5f0l

syqv5f0l1#

emr上的服务使用upstart,支持的重启方法是使用“sudo stop;sudo start<服务名称>”(start和stop命令位于/sbin中,默认情况下位于路径中。)
注意:当前在emr上,有一个限制阻止/sbin/restart正常工作,因此必须使用stop-then-start而不是restart。

5rgfhyps

5rgfhyps2#

我进入主节点,然后运行

$ sudo stop zeppelin
zeppelin stop/waiting

$ sudo start zeppelin
zeppelin start/running, process 24434

紧接着,令人耳目一新的齐柏林飞艇给了我一个503,但大约2分钟后,用户界面再次可用。我检查了/var/log/zeppelin中的日志,配置设置需要一些时间。

8ulbf1ek

8ulbf1ek3#

你试过:

sudo /usr/lib/zeppelin/bin/zeppelin-daemon.sh stop/start?
0aydgbwb

0aydgbwb4#

在EMR5.30及更高版本上,您需要使用sudo systemctl stop和sudo systemctl start命令
https://aws.amazon.com/premiumsupport/knowledge-center/restart-service-emr/

ndasle7k

ndasle7k5#

这听起来可能有点傻,我不知道为什么它会起作用。但是,我在发布守护进程stop/start并让它工作时遇到了问题。但是,如果我能让守护进程运行,启动一个我知道有效的笔记本,然后改成问题笔记本有时可以修复一个挂起,至少到我可以恢复我所做的事情的程度。

相关问题