我想在Hive里做出这样的结果:
| COL1 | HISTOGRAM |
+------+-----------------------+
| a | {"A":2, "B":2} |
| b | {"C":2, "A":1, "B":1} |
从此表中:
| COL1 | COL2 |
+------+------+
| a | A |
| a | B |
| a | A |
| a | B |
| b | A |
| b | B |
| b | C |
| b | C |
presto sql就像我想要的一样,我认为:
select COL1, histogram(COL2)
from sample_table
group by COL1
1条答案
按热度按时间ybzsozfc1#
可以按col1、col2计算counts group,然后使用
collect_set
或者collect_list
在数组中,用逗号作为分隔符连接数组,并使用str_to_map
.演示:
结果: