我们有ambari集群版本2.6.1和hadoop版本2.6.4
数据节点数为-10
从ambari Jmeter 板,我们可以看到显示以下内容的窗口:
DataNodes Live
9/10
但几分钟后,所有数据节点都处于活动状态:
DataNodes Live
10/10
几分钟后我们又见面了
DataNodes Live
9/10
似乎namenode已经超过间隔时间没有从datanode接收到heartbeat消息,那么datanode将被标记为“dead”
我们检查以下内容:
主机解析正常(dns正常)
ip的分辨率正常(dns正常)
hdfs服务检查已成功通过
每个数据节点都已启动(ps-ef | grep datanode | grep-v grep)
netstat-anp | grep'0.0.0.0:50010'端口正常
systemctl status firewalld.service(防火墙已关闭)
sestatus selinux状态(禁用)
mtu配置为9000(我们验证所有组件上的9000设置是否正确)
我们还能做些什么来验证为什么datanode alive不稳定?
1条答案
按热度按时间pes8fvy91#
从那时起,我们将数据节点堆大小从默认值-2g增加到6g,现在来自ambari Jmeter 板的活动数据节点是稳定的