在where子句中使用hive ntile

1dkrff03  于 2021-05-29  发布在  Hadoop
关注(0)|答案(2)|浏览(467)

我想得到配置单元中表的第一个四分位数的汇总数据。下面是一个查询,用于获取每个四分位数中的最大视图数:

SELECT NTILE(4) OVER (ORDER BY total_views) AS quartile, MAX(total_views)
FROM view_data
GROUP BY quartile
ORDER BY quartile;

这个查询是为了得到第一个四分位数中所有人的名字:

SELECT name, NTILE(4) OVER (ORDER BY total_views) AS quartile
FROM view_data
WHERE quartile = 1

两个查询都会出现此错误:

Invalid table alias or column reference 'quartile'

如何引用 ntile 结果 where 条款或 group by 条款?

dpiehjr4

dpiehjr41#

sql中的where语句只能对表架构中的现有列进行选择。为了在计算列上执行该功能,请使用having而不是where。

SELECT name, NTILE(4) OVER (ORDER BY total_views) AS quartile
FROM view_data
HAVING quartile = 1
hs1rzwqc

hs1rzwqc2#

不能在where子句中放置窗口函数,因为如果存在复合 predicate ,它会产生歧义。所以使用子查询。

select quartile, max(total_views) from
(SELECT total_views, NTILE(4) OVER (ORDER BY total_views) AS quartile,
FROM view_data) t
GROUP BY quartile
ORDER BY quartile
;

select * from 
(SELECT name, NTILE(4) OVER (ORDER BY total_views) AS quartile
FROM view_data) t
WHERE quartile = 1
;

相关问题