我们有Hadoop集群包含Phoenix表在HBase服务和支持10k QPS。当在同一个表中运行分析查询时,例如count,group by,出于某种操作目的,它会导致QPS的巨大波动(有时也是0)。因此,为了避免这种情况,我们可以为分析查询启用任何队列,以便它不会干扰OLATP资源。群集大小为18个节点(每个128 GB RAM + 32 vCPU),数据大小为300 GB(约30亿条记录)。
rnmwe5a21#
HBase不是专门针对统计分析而优化的。如果是复杂算法的分布式计算,光是任务调度就会有大量的时间消耗。您可能需要仔细查看不同业务代码的数据物理IO需求,以确定性能瓶颈,
1条答案
按热度按时间rnmwe5a21#
HBase不是专门针对统计分析而优化的。
如果是复杂算法的分布式计算,光是任务调度就会有大量的时间消耗。
您可能需要仔细查看不同业务代码的数据物理IO需求,以确定性能瓶颈,