使用hive获取avg、p50、p95和p99

pjngdqdw  于 2021-05-27  发布在  Hadoop
关注(0)|答案(1)|浏览(1555)

我有一个Hive表有大约3000万行

fruit   sold
----------------
apple   5
apple   10
apple   3
orange  2
orange  5

基于水果,我想得到平均值,p50,p90和p99

fruit   avg     p50     p95     p99
apple   6       4       4       2
orange  3.5     3       3       4
dm7nw8vv

dm7nw8vv1#

你可以用 percentile() :

select fruit, avg(sold), percentile(sold, 0.5), percentile(sold, 0.95), percentile(sold, 0.99)
from t
group by fruit;

相关问题