在哪里可以找到aws emr集群中的节点日志?

dl5txlt9  于 2021-05-17  发布在  Spark
关注(0)|答案(3)|浏览(681)

我有pyspark程序在aws emr集群上运行。集群配置如下:emr-5.31.0、hadoop 2.10.0、hive 2.3.7、hue 4.7.1、pig 0.17.0。
程序在hdfs文件系统上处理一些文件,但有时会出错。
在amazon控制台中-yarn applications-application_(spark)-executors-driver-stderr:'无法获取块。。。文件=
在此消息之前不久,阶段35中的“任务0”失败了4次。正在中止作业'
如果我去amazon控制台-yarn applications-application\u(spark)-stages-35-tasks-0-stdout-我一眼就看不到任何不好的东西,除了很多“gc(allocation failure)”消息。
在其stderr-中有一个警告-'无法获取块,文件=没有活动节点包含当前块块位置:死节点:。抛出blockmissingexception。
如果我转到“监视”选项卡“节点状态”,我会看到一个节点在那个时候变得不健康,就是这样。“实时数据节点”、“mr总节点”、“mr活动节点”、“mr丢失节点”图表中的节点数也发生了变化。
据我所知,任务在hdfs上找不到文件,因为它所在的节点变得不正常。
我的问题是在哪里可以找到节点变得不健康的原因。我在amazon控制台上找不到任何其他日志。可能存在存储此原因的某些节点本地位置?

ijnw1ujt

ijnw1ujt1#

嗨,我不久前自己启动了一个电子病历,不记得日志了。但参考这里的文件:
https://docs.aws.amazon.com/emr/latest/managementguide/emr-manage-view-web-log-files.html
它声明它们存储在机器上(我假设您有密钥),默认情况下它们也存储在s3上。不确定将在哪个bucket中创建它们。
致以最诚挚的问候:)

ojsjcaue

ojsjcaue2#

实际上,对于amazon来说,可以通过s3位置访问更多的日志—有节点引导和配置部分的日志,还有在节点上运行服务的日志—hdfs和yarn,我正在寻找这些日志。路径看起来是这样的-s3位置/集群id/节点/节点id/应用程序-在这里我可以找到hdfs和yarn日志。

dgsult0t

dgsult0t3#

在emr集群的摘要页面上有一个名为“配置详细信息”的部分。
下面是一个名为“loguri”的标签。它指向一个s3uri,但也有一个小文件夹图标。
单击该图标,您可以浏览到emr集群节点上的日志。

相关问题