我正在读取多个输入文件的字数问题。文件名示例:file1.txt file2.txt file3.txt我可以得到字数,但什么应该被添加,如果我也想得到的文件名连同字数存在的地方。例如,文件1的内容:欢迎使用hadoop文件2的内容:这是hadoop电流输出:hadoop 2是1这个1到1欢迎1预期产量:hadoop 2文件01.txt文件02.txt是1 file02.txt此1 file02.txt至1 file01.txt欢迎使用1 file01.txt
2vuwiymt1#
第一个输入一个分割 String file = ((FileSplit)inputSplit).getPath().getName(); 并从Map器中收集单词和文件名作为输出。在reducer中,根据键计算文件名,并递增计数器,然后继续追加文件名。
String file = ((FileSplit)inputSplit).getPath().getName();
file += filename; textString = counter + file; output.collect(key,new Text(textString));
这就解决了问题。
1条答案
按热度按时间2vuwiymt1#
第一个输入一个分割
String file = ((FileSplit)inputSplit).getPath().getName();
并从Map器中收集单词和文件名作为输出。在reducer中,根据键计算文件名,并递增计数器,然后继续追加文件名。
这就解决了问题。