用于配置单元桶的自定义哈希函数

rlcwz9us  于 2021-06-03  发布在  Hadoop
关注(0)|答案(0)|浏览(236)

我需要在带有几个缩减器(例如4)的hive中实现输出结果的总排序。正如我在链接中发现的那样,hive正在使用表达式:
哈希函数(bucketing列)mod num\u bucket。
作为输入的一组数字(41、42、43、51、52、53)的结果,桶将以下一种方式显示:
1桶:52
2铲斗:41、53
3铲斗:42
4铲斗:43,51
因此,输出的顺序将不正确。也许有一种方法可以为数字集的bucketing设置自定义函数,如:
1桶:41,42
2铲斗:43,51
3铲斗:52
4铲斗:53

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题