我一直在尝试用运行在ubuntu18.04上的livy0.7服务器创建一个新的spark会话。在同一台机器上,我有一个运行的spark集群和两个worker,我能够创建一个正常的spark会话。
我的问题是,在对livy服务器运行以下请求后,会话将停留在启动状态:
host = 'http://localhost:8998'
data = {'kind': 'spark'}
headers = {'Content-Type': 'application/json'}
r = requests.post(host + '/sessions', data=json.dumps(data), headers=headers)
r.json()
我可以看到会话正在启动,并从会话日志创建了spark会话:
20/06/03 13:52:31 INFO SparkEntries: Spark context finished initialization in 5197ms
20/06/03 13:52:31 INFO SparkEntries: Created Spark session.
20/06/03 13:52:46 INFO CoarseGrainedSchedulerBackend$DriverEndpoint: Registered executor NettyRpcEndpointRef(spark-client://Executor) (xxx.xx.xx.xxx:1828) with ID 0
20/06/03 13:52:47 INFO BlockManagerMasterEndpoint: Registering block manager xxx.xx.xx.xxx:1830 with 434.4 MB RAM, BlockManagerId(0, xxx.xx.xx.xxx, 1830, None)
以及spark master用户界面:
之后呢 livy.rsc.server.idle-timeout
到达会话日志,然后输出:
20/06/03 14:28:04 WARN RSCDriver: Shutting down RSC due to idle timeout (10m).
20/06/03 14:28:04 INFO SparkUI: Stopped Spark web UI at http://172.17.52.209:4040
20/06/03 14:28:04 INFO StandaloneSchedulerBackend: Shutting down all executors
20/06/03 14:28:04 INFO CoarseGrainedSchedulerBackend$DriverEndpoint: Asking each executor to shut down
20/06/03 14:28:04 INFO MapOutputTrackerMasterEndpoint: MapOutputTrackerMasterEndpoint stopped!
20/06/03 14:28:04 INFO MemoryStore: MemoryStore cleared
20/06/03 14:28:04 INFO BlockManager: BlockManager stopped
20/06/03 14:28:04 INFO BlockManagerMaster: BlockManagerMaster stopped
20/06/03 14:28:04 INFO OutputCommitCoordinator$OutputCommitCoordinatorEndpoint: OutputCommitCoordinator stopped!
20/06/03 14:28:04 INFO SparkContext: Successfully stopped SparkContext
20/06/03 14:28:04 INFO SparkContext: SparkContext already stopped.
在那之后他们死了:(
我已经尝试增加驱动程序超时没有运气,没有发现任何已知的问题,如我猜这与Spark驱动程序连接到rsc,但我不知道在哪里配置
有人知道原因/解决方法吗?
太棒了!
1条答案
按热度按时间j8yoct9x1#
我们在一个环境中也遇到了类似的问题。工作环境和非工作环境之间的唯一区别是livy.conf文件中的spark master设置。
我从livy.conf中删除了配置livy.spark.master=yarn,并从代码本身设置了这个值。
这对我有用。
如果有人能指出这对我有什么帮助的话。