在hadoop中查找x数据范围的一些方法是什么,以便在reducer步骤中将这些范围用作分区?
alen0pnh1#
看起来您需要类似于totalorderpartitioner的东西,它允许通过从外部生成的源中读取拆分点来获得总订单。您可能会发现此链接很有用:http://chasebradford.wordpress.com/2010/12/12/reusable-total-order-sorting-in-hadoop/.不知道这是否正是你需要的?如果我弄错了,我道歉。
1条答案
按热度按时间alen0pnh1#
看起来您需要类似于totalorderpartitioner的东西,它允许通过从外部生成的源中读取拆分点来获得总订单。您可能会发现此链接很有用:http://chasebradford.wordpress.com/2010/12/12/reusable-total-order-sorting-in-hadoop/.
不知道这是否正是你需要的?如果我弄错了,我道歉。