tez-为什么hive中的Map器数量变化如此之大

2mbi3lxu  于 2021-06-24  发布在  Hive
关注(0)|答案(1)|浏览(309)

我有一个名为t1的启用事务的表,我使用tez作为执行引擎。
我不明白为什么这两个查询的查询计划有很大的不同。我应该怎么做来调整这个场景?
从t limit 20中选择t.id,t.id\u type;
-->生成10个Map任务。
插入覆盖表t2从t limit 20中选择t.id作为id,t.id类型作为id类型;
-->生成1100个Map任务。

8fq7wneg

8fq7wneg1#

使用explain extended命令,它将准确地提供正在执行的操作的信息,并显示正在读取的文件。比较两个查询的命令输出。可能它读取不同的文件或做其他事情。

EXPLAIN EXTENDED select t.id, t.id_type from t limit 20;

EXPLAIN EXTENDED insert overwrite table t2 select t.id as id, t.id_type as id_type from t limit 20;

相关问题