简单配置单元选择不提供完整结果

g0czyy6m  于 2021-06-24  发布在  Hive
关注(0)|答案(1)|浏览(295)

我正在查询一个表,我们称之为“customer\u table”,它有“yyyymmdd”格式的按天划分的分区。当我们用 'show partitions customer_table' 我可以看到昨天和前天的数据。但是,当我运行如下查询时:

'select customer, customer_joined_date, name, address, city
from customer_table ct
left join addresses addr on ct.cust_id=addr.cust_id
where ct.customer_joined_date >= date_format(date_sub(current_date,7),'yyyyMMdd')

此查询不包括昨天或前一天的数据。我的直觉是,前两天分区有某种锁,当数据仍流入分区时,它会阻止查询。
你能告诉我发生了什么事吗?是否有一个我可以设置的环境参数,以便查询忽略“locks”?

f0ofjuux

f0ofjuux1#

你能做下面的查询只是为了检查连接中没有什么奇怪的东西吗-

select max(customer_joined_date)
  from customer_table ct
  Where ct.customer_joined_date >= date_format(date_sub(current_date,7),'yyyyMMdd');

如果仍然看不到来自最新分区的数据,可以尝试对最新分区执行一次收集统计信息的操作,看看是否有任何可能。下面是一个语法示例。

ANALYZE TABLE Table1 PARTITION(ds='2008-04-09') COMPUTE STATISTICS;

相关问题