我们有两个系统—一个脱机系统(这里的性能并不重要),其中mapreduce作业在hbase集群上运行。另一个是在线系统(这里的性能非常关键),api从同一个hbase集群读取数据。但是由于mapreduce作业在同一集群上运行,因此在线系统上存在性能问题。因此,我们尝试为离线系统建立单独的hbase集群,即从源集群复制少数家族名称。所以在源代码繁重的mapreduce作业上运行。在复制的集群上,只有联机系统运行才能提供最佳性能。我的问题是:我们不能在hbase中使用快照功能来做同样的事情吗?我也想知道他们之间有什么区别?
1条答案
按热度按时间r6vfmomb1#
如果您使用mapreduce的快照功能,它还将在活动的hbase群集节点上花费cpu、内存和磁盘io。因此,如果磁盘io或cpu是您的瓶颈,一个单独的mapreduce作业集群是更好的解决方案。