我有以下文件:
Item1 : frequencyOfItem1
Item2 : frequencyOfItem2
...
ItemN : frequencyOfItemN
几句台词之后。。。
Pair1: Item1, Item2 Value1
Pari2: ItemX, ItemY Value2
....
PairN: ItemXN, ItemYN ValueN
我想用map reduce方法计算以下新值:
ParirX: ItemX, ItemY ValueX/FrequencyItemNX
我该如何Map和减少该操作的值?
1条答案
按热度按时间bbmckpt71#
这是有可能解决这个问题,做两个工作相结合
mapper:在mapper中,键是itemx,并为所有其他元素赋值
reducer:输出所有的值(以这种方式,我基于itemx连接这些值)
工作2
Map器两个键,一个键是整行,值是valuex,第二个键是整行,值是frequencyitemnx
reducer输出键值之间的除法