amazon web服务—为什么我们看到presto查询运行时间出现峰值?

bvpmtnay  于 2021-06-27  发布在  Hive
关注(0)|答案(1)|浏览(316)

我们正试图调试为什么presto查询的运行时间在一天中变化很大。我们看到了几个显著的峰值,有的在工作时间内,有的在工作时间以外。我们使用的是emr版本5.14和presto版本0.194。我们的数据存储在s3中,使用hive创建的Parquet文件。下图显示了一段时间内使用presto cli的同一查询的运行时间。任何关于我们应该关注什么或可能导致这些峰值的想法/建议都将不胜感激。谢谢!

ohfgkhjo

ohfgkhjo1#

发布此消息以防其他人有此问题。我们最终禁用了hive.properties中的配置单元统计信息,从而提高了性能。

相关问题