hive连接查询非常慢

mhd8tkvw  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(279)

我试图用6个减速机运行下面的查询,但我总是看到只有一个减速机启动。不确定为什么忽略tasks参数。请帮助(我使用较旧版本的配置单元,因此不支持not in查询)
设置mapred.reduce.tasks=6;
从test1 left outer join test2中选择concat(test1.col\u 0,test1.col\u 1),其中concat(test1.col\u 0,test1.col\u 1)=concat(test2.col\u 0,test2.col\u 1),concat(test2.col\u 0,test2.col\u 1)为空;

5kgi1eie

5kgi1eie1#

重新发布评论作为答案:
是否可以尝试将第一个where子句转换为on条件:

select concat(test1.col_0,test1.col_1) from test1 left outer join test2 ON concat(test1.col_0,test1.col_1) = concat(test2.col_0,test2.col_1) where concat(test2.col_0,test2.col_1) IS NULL;

相关问题