在hadoop中生成多个大小相等的输出文件

esyap4oy  于 2021-06-04  发布在  Hadoop
关注(0)|答案(1)|浏览(400)

在hadoop中查找x数据范围的一些方法是什么,以便在reducer步骤中将这些范围用作分区?

alen0pnh

alen0pnh1#

看起来您需要类似于totalorderpartitioner的东西,它允许通过从外部生成的源中读取拆分点来获得总订单。您可能会发现此链接很有用:http://chasebradford.wordpress.com/2010/12/12/reusable-total-order-sorting-in-hadoop/.
不知道这是否正是你需要的?如果我弄错了,我道歉。

相关问题