如何实现namenode的高可用性?我们应该在集群中配置一些东西吗
pdtvr36n1#
datanode:他们做实际工作。。namenode:负责管理datanodes。一个集群可以有许多datanode,但只能有一个namenode。在一组物理框中,通常一个框运行namenode,而其他框运行datanode。将namenode与执行繁重工作的datanode分开是一个好主意。原因是namenode的工作已经是内存密集型的。namenode可能是集群的单点故障也没有帮助。因此,经常重复的建议是保持namenode在一个独立的高可用性服务器上以防弹的可靠性运行。
uurv41yg2#
互联网上有很多关于如何在hadoopv1中做到这一点的资源。http://www.hadoopsphere.com/2012/11/understanding-high-availability-options.html 或者http://hortonworks.com/blog/ha-namenode-for-hdfs-with-hadoop-1-0-part-1/在hadoop2.0中,这一问题已经得到了解决。
2条答案
按热度按时间pdtvr36n1#
datanode:他们做实际工作。。
namenode:负责管理datanodes。
一个集群可以有许多datanode,但只能有一个namenode。在一组物理框中,通常一个框运行namenode,而其他框运行datanode。
将namenode与执行繁重工作的datanode分开是一个好主意。原因是namenode的工作已经是内存密集型的。namenode可能是集群的单点故障也没有帮助。因此,经常重复的建议是保持namenode在一个独立的高可用性服务器上以防弹的可靠性运行。
uurv41yg2#
互联网上有很多关于如何在hadoopv1中做到这一点的资源。http://www.hadoopsphere.com/2012/11/understanding-high-availability-options.html 或者http://hortonworks.com/blog/ha-namenode-for-hdfs-with-hadoop-1-0-part-1/
在hadoop2.0中,这一问题已经得到了解决。