sparkDataframe与设计hbase:一表多列vs多表一列族

yb3bgrhw  于 2021-06-09  发布在  Hbase
关注(0)|答案(1)|浏览(295)

我在oracle数据库中有多个表。我想把这个表复制到hbase上,最好的设计是什么,一个表有多个列族,每个列族代表一个oracle表?或hbase上的多个表(一个列族包含所有字段)或多个表(多个列族包含一个列限定符)?
在那之后,我会使用spark dataframe来运行一些作业,并像oracle一样进行查询!!
你用哪种策略?
热忱地

50pmv0ei

50pmv0ei1#

不建议对一个表使用多列族(多于3列族)。
请参阅hbase手册
所以你有其他的选择,你提到的,更适合你的要求和你的设计类型。

相关问题