使用mapreduce在不同的文件中为不同的输入文件编写文本输出

xienkqul  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(698)

如何使用mapreduce为不同的输入文件在不同的文件中写入输出例如假设我想从video.txt和outlier.txt计算每个文件中的术语频率,结果分别存储在video1.txt和oulier1.txt中?

xurqigkl

xurqigkl1#

在Map器中,将文件名附加到找到的每个单词。您的密钥将是“word+filename”。确保分区程序使用“filename”进行分区,以便同一文件中的所有字都以相同的大小写结束

相关问题