hive group by中的多个列

hs1ihplo  于 2021-05-18  发布在  Spark
关注(0)|答案(0)|浏览(383)

Hive是如何在Hive内部进行分组的?
所用发动机:tez
问题是,我必须按50列进行分组并进行一些计算,我猜hive正在创建一个巨大的字符串作为reducer中的键,它将耗尽我的内存。
我在哪里能找到幕后发生的事情的简要解释?
作为一种可能的解决方法,我正在考虑对字符串进行散列并按该散列进行分组。。。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题