我正在尝试处理csv文件。 In map()
我将把每一列作为一个值发送给reducer。 In reducer
我将找到最小值和最大值,并进一步处理。处理后,我需要上下文。写的值。但试图在一个特定的方式输出。
在reducer中,我处理每一列,但我需要输出整个列 row
即col1的值、col2的值、col3的值、col4的值。
从减速机处理后的样本数据
in reducer
0.62
0.38
0.9
in reducer
0.24
0.59
0.1
in reducer
0.5
1.0
0.2
in reducer
0.0
0.0
0.3
预期产量
0.62,0.24,0.5,0.5
0.38,0.59,1.0,0.0
0.9,0.1,0.2,0.3
是否有可能在每次迭代中处理reducer中的每个不同键
key1value1,key2value1,key3value1
key1value2,key2value2,key3value2
有什么建议吗
1条答案
按热度按时间tzdcorbm1#
使用mapreduce链接可以执行此操作
使用像这样的文本类型在单行中编写reducer输出
再次对第一个mapreduce的输出文件执行mapreduce。