accumulo上的配置单元建议设置

sczxawaw  于 2021-06-26  发布在  Hive
关注(0)|答案(1)|浏览(339)

我们使用Hive(v。1.2.1)在accumulo(v。1.7.1)表格。
有什么特殊的设置,我们可以配置在Hive或其他地方,以获得我们的性能或稳定性?
如果我们以这种方式使用配置单元,有什么意义吗?例如,尝试一些配置单元索引或类似“hive.auto.convert.join”之类的设置,或者它以不同的方式工作,在这种情况下不会产生实际影响?
谢谢您!

lawou6xi

lawou6xi1#

强制性:我写了(大部分)accumulostoragehandler,但我绝不是蜂群Maven。
您可能能找到的最大好处是,当您能够以这样一种方式构造查询时,您可以修剪行空间(通过where子句中的一个语句覆盖:rowid mapped列)。据我所知,没有多少(任何?)查询优化被下推到accumulo本身。
根据您的工作负载,您可以使用hive在acumulo中生成自己的“索引表”。如果您可以创建一个自定义表,该表的accumulo行中存储了您要主动查询的列,那么您的查询应该运行得更快。

相关问题