我们在数据仓库解决方案中广泛使用hive。许多计划作业和临时查询正在访问这些。我如何才能找到哪些Hive表在我的公司最受欢迎。所以我可以采取一些行动来改善它。
8zzbczxx1#
您没有提到要在哪个版本的hadoop上运行配置单元,但如果是cloudera,您可以查看cloudera navigator optimizer:http://blog.cloudera.com/blog/2015/11/introducing-cloudera-navigator-optimizer-for-optimal-sql-workload-efficiency-on-apache-hadoop/分析sql工作负载以获得跨多个维度的可见性,包括:“ Jmeter 板”视图:sql操作、表使用和查询使用模式的视图一个流行的视图:最常用的表、查询和列模式深入查看:每个表和查询的主要特征、模式和复杂性亮点视图:从分析整个工作负载中得出的主要见解https://www.cloudera.com/documentation/navopt/topics/evaluatinghiveimpalaworkloads.html用例:通过cpu时间、内存使用和文件系统读/写来评估查询集即使没有cloudera navigator optimizer,而且只有cloudera navigator,我猜您也可以从navigator的solr后端数据库获得类似的数据。我不知道有任何其他产品提供类似的功能(我不隶属于cloudera,但使用他们的产品作为客户)。
1条答案
按热度按时间8zzbczxx1#
您没有提到要在哪个版本的hadoop上运行配置单元,但如果是cloudera,您可以查看cloudera navigator optimizer:
http://blog.cloudera.com/blog/2015/11/introducing-cloudera-navigator-optimizer-for-optimal-sql-workload-efficiency-on-apache-hadoop/
分析sql工作负载以获得跨多个维度的可见性,包括:
“ Jmeter 板”视图:sql操作、表使用和查询使用模式的视图
一个流行的视图:最常用的表、查询和列模式
深入查看:每个表和查询的主要特征、模式和复杂性
亮点视图:从分析整个工作负载中得出的主要见解
https://www.cloudera.com/documentation/navopt/topics/evaluatinghiveimpalaworkloads.html
用例:通过cpu时间、内存使用和文件系统读/写来评估查询集
即使没有cloudera navigator optimizer,而且只有cloudera navigator,我猜您也可以从navigator的solr后端数据库获得类似的数据。
我不知道有任何其他产品提供类似的功能(我不隶属于cloudera,但使用他们的产品作为客户)。