我刚开始使用hadoop,我想知道 what all the factors that needs to be looked at when a Map Reduce job(say via Hive or Snapplex) is being triggered to ensure that the cluster is stable and that job does not do any major impact
到集群
在哪里可以找到所有这些检查点?是否有任何标准阈值可以跟踪?
基本上是一个系统健康检查,以确保我们构建的mr作业是干净的
感谢你的真知灼见
1条答案
按热度按时间xdnvmnnf1#
hadoop通常包括namenode和jobtracker webinterface,用于监视目的。
namenodeui提供了可用节点、总体集群容量以及死节点的概述。
jobtracker ui概述了正在运行和失败的作业及其日志输出。
对namenode的默认访问是通过http://localhost:50070/. 对于求职者:http://localhost:8088(这可能因您使用的hadoop发行版而异)