通过ssh隧道访问的emr spark history服务器ui不显示日志

nvbavucw  于 2021-05-27  发布在  Spark
关注(0)|答案(1)|浏览(373)

这个 /var/log/spark/apps/ 已在我们的emr群集上删除文件夹。我用相同的名称创建了一个新的hdfs文件夹,并将权限更改为 777 . 现在,每个spark应用程序都成功地将日志写入这个hdfs文件夹。
不过,该文件夹中还有其他内容,允许您通过ssh隧道连接到的spark history服务器显示应用程序日志列表。它在文件夹被删除之前工作得很好,但是现在它不显示任何spark应用程序日志(完整或不完整),即使 hdfs dfs -ls /var/log/spark/apps/ 显示文件夹中充满了日志。
通过emr aws控制台访问的spark history服务器仍然可以工作,但这并不理想,因为它明显落后于通过ssh隧道访问的spark history服务器。
我还需要什么项目来还原到这个文件夹,以便通过ssh隧道打开的spark history服务器显示这些日志?
在windows计算机上,以下powershell代码仍能正确打开spark history server ui,但该ui不显示任何日志:

Start-Process powershell "-noexit", `
"`$host.ui.RawUI.WindowTitle` = 'Spark HistoryServer'; `
Start-Process chrome.exe http://localhost:8158 ; `
ssh -N -L 8158:ip-10-226-66-190.us-east-2.compute.internal:18080 hadoop@10.226.66.190"

注意:我还停止并重新启动了spark历史服务器。
sudo stop spark-history-server sudo start spark-history-server 也: sudo -s ./$SPARK_HOME/sbin/start-history-server.sh

kjthegm6

kjthegm61#

更改权限可以修复它。

hdfs dfs -chmod -R 777 /var/log/spark/apps/

相关问题