在hbase中,为了避免时间序列数据的热插拔,采用了盐析机制来实现数据的均匀分布。我们可以把table预先分到 number_of_regions
然后应用这个公式得到salted前缀 salt = key.hashCode() % number_of_regions)
.
新的rowkey将
new_row_key = salt+key number_of_regions
不是静态的,会随着负载的增加而增加。我的问题是,当这种情况发生时,这种策略是否能有效地平均分配数据。或者我需要在每次构建salt前缀之前检查区域数?
暂无答案!
目前还没有任何答案,快来回答吧!