目前通过livy,我正在向azurehdinsight集群发布/提交spark作业。作业完成后,我正在寻找park历史服务器的yarn日志。livy log for each spark job不提供yarn日志。我们能否以编程方式从azure hdinsight获取spark yarn日志。我们在azure中有任何rest调用或自定义工具来获取yarn日志吗
1cklez4t1#
为了将来调查这个问题,请您提供更多关于这个场景的信息:你到底是如何将spark作业提交给azure hdinsight的?你是否在关注任何文章,如果是请提供文章的链接,或者请分享确切的步骤?当您从ambari用户界面启动yarn用户界面时,您是否能够看到提交spark作业时关联的应用程序标识?同时,您可以 checkout 在azurehdinsight上运行的调试apachespark作业。我们能否以编程方式从azure hdinsight获取spark yarn日志。我们在azure中有任何rest调用或自定义工具来获取yarn日志吗使用这些api向hdinsight spark集群提交远程作业。所有任务操作都符合http/1.1协议。确保您正在使用带有spark管理员凭据的http基本身份验证对spark群集管理终结点进行身份验证。reference:azure hdinsight spark-远程作业提交rest api您可以按以下格式向livy端点提交get:https://<your\u hdi\u url>/livy/batches/<your job id>/logreference:get the 批处理作业的完整日志。
https://<your\u hdi\u url>/livy/batches/<your job id>/log
1条答案
按热度按时间1cklez4t1#
为了将来调查这个问题,请您提供更多关于这个场景的信息:
你到底是如何将spark作业提交给azure hdinsight的?
你是否在关注任何文章,如果是请提供文章的链接,或者请分享确切的步骤?
当您从ambari用户界面启动yarn用户界面时,您是否能够看到提交spark作业时关联的应用程序标识?
同时,您可以 checkout 在azurehdinsight上运行的调试apachespark作业。
我们能否以编程方式从azure hdinsight获取spark yarn日志。我们在azure中有任何rest调用或自定义工具来获取yarn日志吗
使用这些api向hdinsight spark集群提交远程作业。所有任务操作都符合http/1.1协议。确保您正在使用带有spark管理员凭据的http基本身份验证对spark群集管理终结点进行身份验证。
reference:azure hdinsight spark-远程作业提交rest api
您可以按以下格式向livy端点提交get:
https://<your\u hdi\u url>/livy/batches/<your job id>/log
reference:get the 批处理作业的完整日志。