一个区域服务器可以服务多少个区域?基本上,我得到了一个hadoop的工作,在hbase中进行批量加载,但是在hbase主ui中,我可以看到整个数据流量都转移到了单区域服务器上,因为哪个单区域服务器过载了,其他的都很理想。我想将这些区域分布在区域服务器上,以保持集群的平衡。我不太确定,但我假设应该有一些配置来定义每个区域服务器的区域数。如果我错了,请纠正我。目前,我正在为我的hbase表使用默认的自动拆分策略。让我知道如何确定这一点或任何其他方式来处理地区分布?谢谢
wwodge7n1#
我假设您创建了一个拆分表,然后它会根据您的数据大小自动拆分。hbase balance表根据每个区域服务器的拆分数量进行拆分,因此,如果您希望多个区域服务器为多个拆分提供服务,则应根据某些逻辑预拆分表,或者在使用“表中有一些数据”时单击用户界面中的“拆分”。你可以读这篇很详细的文章http://hortonworks.com/blog/apache-hbase-region-splitting-and-merging/如果有人知道如何根据该表的负载分配拆分,那就太好了。
ca1c2owp2#
让我猜猜看。您创建了一个没有预裂的表。大量的数据被加载到这个地区。现在你有麻烦了。请尝试以下操作:而(存在大于10g的区域)do 1。在hbase shell中拆分大于10g的区域。2主要是压缩子区域。完成提示。散装前先把table预裂。
2条答案
按热度按时间wwodge7n1#
我假设您创建了一个拆分表,然后它会根据您的数据大小自动拆分。hbase balance表根据每个区域服务器的拆分数量进行拆分,因此,如果您希望多个区域服务器为多个拆分提供服务,则应根据某些逻辑预拆分表,或者在使用“表中有一些数据”时单击用户界面中的“拆分”。
你可以读这篇很详细的文章http://hortonworks.com/blog/apache-hbase-region-splitting-and-merging/
如果有人知道如何根据该表的负载分配拆分,那就太好了。
ca1c2owp2#
让我猜猜看。
您创建了一个没有预裂的表。
大量的数据被加载到这个地区。
现在你有麻烦了。请尝试以下操作:
而(存在大于10g的区域)do 1。在hbase shell中拆分大于10g的区域。2主要是压缩子区域。完成
提示。
散装前先把table预裂。