我有Hive表和视图上的表。在使用where子句对分区列执行表查询时,我从explain中看到查询使用的是分区列。但在视图上运行相同的查询时,它从explain plan中显示不使用分区键。请建议
示例代码在这里,视图是在where子句中按国家/地区代码筛选的所有列的表上创建的(select*from where country\ U code='xx')
用于表的查询
SELECT a.unique_id,
a.country_code,
a.rpt_prd,
a.abv_cut_off_scor_flag,
a.acct_und_promo_flag,
.
.
b.arrg_cob_dt,
b.arrg_id
from
a
inner join
b
on a.country_code = b.country_code
and a.product_code = b.product_code
and a.rpt_prd =b.rpt_prd
and a.unique_id =b.unique_id
and a.arrg_id = b.arrg_id
WHERE a.country_code='XX'
AND a.product_code = 'YYYYY'
AND a.rpt_prd ='20171231' ;
a
======================================
Partition Key for - a
PARTITIONED BY ( |
| `country_code` string, |
| `product_code` string, |
| `rpt_prd` string, |
| `unique_id` string)
b
=======================================
PARTITIONED BY ( |
| `country_code` string, |
| `product_code` string, |
| `rpt_prd` string, |
| `unique_id` string)
Query using Views:
===================
SELECT a.unique_id,
a.country_code,
a.rpt_prd,
a.abv_cut_off_scor_flag,
a.acct_und_promo_flag,
.
.
b.arrg_cob_dt,
b.arrg_id
from
a
inner join
b
on a.country_code = b.country_code
and a.product_code = b.product_code
and a.rpt_prd =b.rpt_prd
and a.unique_id =b.unique_id
and a.arrg_id = b.arrg_id
WHERE a.country_code='XX'
AND a.product_code = 'YYYYY'
AND a.rpt_prd ='20171231' ;
1条答案
按热度按时间ffscu2ro1#
由于视图使用与实际表相同的基础数据,因此它应该使用分区。也就是说,其他人也有这个问题
一种可能的解决方法是通过创建分区视图语法使视图明确地知道分区,如下所示: