我和一个运行hadoop处理mapreduce作业的老项目一起工作,目前我正努力加入到工作中。我有两个文件,比如:
文件1:
onion vegetable
potato vegetable
orange fruit
apple fruit
banana fruit
carrot vegetable
melon fruit
第二个文件是文件2:
1 apple
2 banana
3 carrot
4 orange
5 melon
6 onion
我想要的是蔬菜项目的指数,所以预期的项目是:
3
6
我不知道该怎么办。我以前从未使用过plainjane hadoop,所以我不确定是否遗漏了一些简单的东西。请注意,文件2和文件1中的条目在另一个文件中可能没有对应的匹配项。
指针会有帮助的。
暂无答案!
目前还没有任何答案,快来回答吧!