如何在不同地区安装的多个azure hdinsight(hbase)群集上运行查询?

t98cgbkg  于 2021-06-09  发布在  Hbase
关注(0)|答案(1)|浏览(435)

我是azure和hbase的新手。假设我有两个hdinsight(hbase)集群,一个安装在亚洲,另一个安装在欧洲,以便为来自不同国家的用户访问提供更好的读/写性能。但是如何对这些集群的所有数据运行查询呢?我是否需要在所有集群上分别运行查询,然后合并结果?或者有一些内置函数,比如sqlserver的分布式查询

vqlkdk9b

vqlkdk9b1#

hbase中没有跨集群的分布式查询。在您的场景中,最好的解决方案可能是在两个hbase集群之间设置复制,然后查询其中一个集群。由于复制是异步的,两个集群中的数据都将在几分钟内完成,而另一个集群中的数据将过时。您还可以设置更复杂的复制类型,并拥有一个单独的中心集群,其中包含数据的超集,而另外两个集群则具有其本地子集。
hdinsight团队正在为azure中的复制设置编写文档。目前,您需要自己发现配置。您需要在vnets中配置集群,连接vnets,确保它们具有正确的名称解析设置,然后使用hbase复制设置步骤来设置复制本身:http://hbase.apache.org/book.html#_cluster_replication
如果没有复制解决方案,则需要分别查询这两个集群。

相关问题