我们正试图调试为什么presto查询的运行时间在一天中变化很大。我们看到了几个显著的峰值,有的在工作时间内,有的在工作时间以外。我们使用的是emr版本5.14和presto版本0.194。我们的数据存储在s3中,使用hive创建的Parquet文件。下图显示了一段时间内使用presto cli的同一查询的运行时间。任何关于我们应该关注什么或可能导致这些峰值的想法/建议都将不胜感激。谢谢!
我们正试图调试为什么presto查询的运行时间在一天中变化很大。我们看到了几个显著的峰值,有的在工作时间内,有的在工作时间以外。我们使用的是emr版本5.14和presto版本0.194。我们的数据存储在s3中,使用hive创建的Parquet文件。下图显示了一段时间内使用presto cli的同一查询的运行时间。任何关于我们应该关注什么或可能导致这些峰值的想法/建议都将不胜感激。谢谢!
1条答案
按热度按时间ohfgkhjo1#
发布此消息以防其他人有此问题。我们最终禁用了hive.properties中的配置单元统计信息,从而提高了性能。