散列行键与单调递增行键

r8xiu3jd  于 2021-06-09  发布在  Hbase
关注(0)|答案(1)|浏览(281)

我在多个地方读到过,散列单调递增的行键有助于通过分发数据来防止区域热点
https://stackoverflow.com/a/17969852/4495849
http://hbase.apache.org/book.html#rowkey.design
我担心的是,这会增加太多的搜索,破坏hdfs的好处。是否存在这样一种情况:保持行键不被移除将产生更好的性能。更好的分配的好处是否大于增加的寻道时间?
我的rowkey是timestamp和id的组合。每个id大约有20000个id和525600个(一年的分钟读数)。在许多小的或大的时间范围内对小的和大的id组进行请求

b5buobof

b5buobof1#

有些时候,未经处理的钥匙会给你带来好处。当您需要读取某个范围内的数据的某个重要部分时,例如从“”到“zzz”的所有字符串。在这种情况下,未损坏的钥匙将给您带来可观的好处。您可以使用scan和start和sot rows键。hbase将只读取此数据。在散列键的情况下,您需要扫描孔表并根据这个范围标准过滤值。

相关问题