这个 /var/log/spark/apps/
已在我们的emr群集上删除文件夹。我用相同的名称创建了一个新的hdfs文件夹,并将权限更改为 777
. 现在,每个spark应用程序都成功地将日志写入这个hdfs文件夹。
不过,该文件夹中还有其他内容,允许您通过ssh隧道连接到的spark history服务器显示应用程序日志列表。它在文件夹被删除之前工作得很好,但是现在它不显示任何spark应用程序日志(完整或不完整),即使 hdfs dfs -ls /var/log/spark/apps/
显示文件夹中充满了日志。
通过emr aws控制台访问的spark history服务器仍然可以工作,但这并不理想,因为它明显落后于通过ssh隧道访问的spark history服务器。
我还需要什么项目来还原到这个文件夹,以便通过ssh隧道打开的spark history服务器显示这些日志?
在windows计算机上,以下powershell代码仍能正确打开spark history server ui,但该ui不显示任何日志:
Start-Process powershell "-noexit", `
"`$host.ui.RawUI.WindowTitle` = 'Spark HistoryServer'; `
Start-Process chrome.exe http://localhost:8158 ; `
ssh -N -L 8158:ip-10-226-66-190.us-east-2.compute.internal:18080 hadoop@10.226.66.190"
注意:我还停止并重新启动了spark历史服务器。
sudo stop spark-history-server sudo start spark-history-server
也: sudo -s ./$SPARK_HOME/sbin/start-history-server.sh
1条答案
按热度按时间kjthegm61#
更改权限可以修复它。