查找最常用的配置单元表

mpbci0fu 于 2021-06-26 发布在 Hive

关注(0)|答案(1)|浏览(383)

我们在数据仓库解决方案中广泛使用hive。许多计划作业和临时查询正在访问这些。我如何才能找到哪些Hive表在我的公司最受欢迎。
所以我可以采取一些行动来改善它。

Hive data-warehouse

来源：https://stackoverflow.com/questions/48567865/finding-top-most-used-hive-tables

1条答案

按热度按时间

8zzbczxx1#

您没有提到要在哪个版本的hadoop上运行配置单元，但如果是cloudera，您可以查看cloudera navigator optimizer：
http://blog.cloudera.com/blog/2015/11/introducing-cloudera-navigator-optimizer-for-optimal-sql-workload-efficiency-on-apache-hadoop/
分析sql工作负载以获得跨多个维度的可见性，包括：
“ Jmeter 板”视图：sql操作、表使用和查询使用模式的视图
一个流行的视图：最常用的表、查询和列模式
深入查看：每个表和查询的主要特征、模式和复杂性
亮点视图：从分析整个工作负载中得出的主要见解
https://www.cloudera.com/documentation/navopt/topics/evaluatinghiveimpalaworkloads.html
用例：通过cpu时间、内存使用和文件系统读/写来评估查询集
即使没有cloudera navigator optimizer，而且只有cloudera navigator，我猜您也可以从navigator的solr后端数据库获得类似的数据。
我不知道有任何其他产品提供类似的功能（我不隶属于cloudera，但使用他们的产品作为客户）。

赞(0）回复(0）举报 2021-06-26

我来回答

查找最常用的配置单元表

1条答案

相关问题

热门标签

最新问答