我们将hbase用于小对象。我注意到hbase的存储占用空间太大了。原始数据与hbase数据之间的比率达到5倍。
仅供参考,我们的数据由小对象组成。每个对象大约有20个字段(存储在hbase表的每个单元格中)。由于每个字段值的平均大小为20字节,因此用于存储值的hbase的数据开销(列族、列限定符、时间戳等)会使hbase文件大得多。
目前,我们正在使用数据块编码算法(fast-diff)来节省一些空间。但是,我们不能将其降低到接近2倍的水平(与原始数据相比)。
你们中有人面对过hbase的这种行为吗?你有什么建议?
暂无答案!
目前还没有任何答案,快来回答吧!