hadoop、oozie中作业、应用程序、任务、任务尝试日志之间的区别

oyjwcjzk  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(334)

我正在运行一个oozie工作与多个行动,有一部分我不能使它工作。在排除故障的过程中,我被大量的日志压得喘不过气来。
Yarn界面( yarn.resourceman­ager.webapp.address 在yarn-site.xml(通常位于端口8088)中 application_<app_id> 日志。
在作业历史记录服务器中( yarn.log.server.url 在yarn-site.xml中,我们的端口号是19888) job_<job_id> 日志(这些作业日志也应该显示在hue的作业浏览器上,对吗?)
在hue的oozie工作流编辑器中,有 task 以及 task_attempt (不确定它们是否相同,对我来说,所有的东西都是混合的汤),如果你点击这里和那里,它会重定向到工作浏览器。
有人能从hadoop/oozie架构的Angular 解释一下这些东西之间的区别吗?
p、 我在日志里见过 container_<container_id> 也。不妨在你对上述事情的解释中包含这一点。

jfgube3f

jfgube3f1#

就yarn而言,在集群上运行的程序称为应用程序。在mapreduce中,它们被称为jobs。因此,如果您在yarn上运行mapreduce,那么作业和应用程序是相同的(如果仔细观察,作业id和应用程序id是相同的)。
mapreduce作业由多个任务组成(它们可以是map或reduce任务)。如果任务失败,它将在另一个节点上再次启动。这些都是任务尝试。
容器是一个术语。这是资源分配的一个单位。例如,mapreduce任务将在单个容器中运行。

相关问题