使用hadoopmapreduce的连接样式合并

blmhpbnm 于 2021-05-29 发布在 Hadoop

关注(0)|答案(0)|浏览(230)

我和一个运行hadoop处理mapreduce作业的老项目一起工作，目前我正努力加入到工作中。我有两个文件，比如：
文件1：

onion vegetable
potato vegetable
orange fruit
apple fruit
banana fruit
carrot vegetable
melon fruit

第二个文件是文件2：

1 apple
2 banana
3 carrot
4 orange
5 melon
6 onion

我想要的是蔬菜项目的指数，所以预期的项目是：

3
6

我不知道该怎么办。我以前从未使用过plainjane hadoop，所以我不确定是否遗漏了一些简单的东西。请注意，文件2和文件1中的条目在另一个文件中可能没有对应的匹配项。
指针会有帮助的。

目前还没有任何答案，快来回答吧！

相关问题