使用hadoopmapreduce的连接样式合并

blmhpbnm  于 2021-05-29  发布在  Hadoop
关注(0)|答案(0)|浏览(223)

我和一个运行hadoop处理mapreduce作业的老项目一起工作,目前我正努力加入到工作中。我有两个文件,比如:
文件1:

onion vegetable
potato vegetable
orange fruit
apple fruit
banana fruit
carrot vegetable
melon fruit

第二个文件是文件2:

1 apple
2 banana
3 carrot
4 orange
5 melon
6 onion

我想要的是蔬菜项目的指数,所以预期的项目是:

3
6

我不知道该怎么办。我以前从未使用过plainjane hadoop,所以我不确定是否遗漏了一些简单的东西。请注意,文件2和文件1中的条目在另一个文件中可能没有对应的匹配项。
指针会有帮助的。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题