一般来说,对于较小的查询(以交互方式预期结果,以分钟为单位,而不是以小时为单位),tez的性能更好吗?对于批量查询(以小时为单位),mr作为执行引擎的性能更好吗?或者我们可以说,不管查询类型如何,tez始终是最佳选择吗?
u0sqgete1#
tez简化了小规模(低延迟)和大规模(高吞吐量)工作负载的处理。查询越复杂,tez带来的好处就越多。对于由单个Map步骤组成的简单查询,很可能根本没有区别,因为没有什么需要优化的。tez将查询表示为dag (有向无环图),并消除了不必要的步骤,如读/写持久存储,从每个Map的输出排序,还支持容器重用。tez总是最好的选择,对于简单的查询,它不会比mr差,对于复杂的查询,它会更好。考虑一下:对于mr和tez,您必须调整不同的配置参数集,有很多tez特定的和mr特定的。选择tez,你将简化你的生活,即使在没有什么可以优化的情况下。另外,在hive2版本中,mr上的hive也被弃用。
1条答案
按热度按时间u0sqgete1#
tez简化了小规模(低延迟)和大规模(高吞吐量)工作负载的处理。查询越复杂,tez带来的好处就越多。对于由单个Map步骤组成的简单查询,很可能根本没有区别,因为没有什么需要优化的。tez将查询表示为dag (有向无环图),并消除了不必要的步骤,如读/写持久存储,从每个Map的输出排序,还支持容器重用。tez总是最好的选择,对于简单的查询,它不会比mr差,对于复杂的查询,它会更好。考虑一下:对于mr和tez,您必须调整不同的配置参数集,有很多tez特定的和mr特定的。选择tez,你将简化你的生活,即使在没有什么可以优化的情况下。另外,在hive2版本中,mr上的hive也被弃用。