hadoopmapreduce：当我指定多个reducer时，最终的hdfs结果文件在哪里？

xlpyo6sf 于 2021-05-29 发布在 Hadoop

关注(0)|答案(1)|浏览(308)

我有一个wordcount.java程序，并对其进行了修改，以支持多个Map器和还原器，如下所示：

public class WordCount extends Configured implements Tool {
    public int run(String[] args) throws Exception {
        JobConf conf = new JobConf(getConf(), w1_args.class);
        for (int i = 0; i < args.length; ++i) {
            if ("-m".equals(args[i])) {
                conf.setNumMapTasks(Integer.parseInt(args[++i]));
            } else if ("-r".equals(args[i])) {
                conf.setNumReduceTasks(Integer.parseInt(args[++i]));
            } else {
                //
            }
            ...

然后我编译并运行它：

hadoop jar WordCount-1.0-SNAPSHOT.jar WordCount -m 3 -r 15 input output

它运行良好，当我检查输出目录时：

$ hdfs dfs -ls output-18
Found 16 items
output-18/_SUCCESS
output-18/part-00000
output-18/part-00001
output-18/part-00002
output-18/part-00003
output-18/part-00004
output-18/part-00005
output-18/part-00006
output-18/part-00007
output-18/part-00008
output-18/part-00009
output-18/part-00010
output-18/part-00011
output-18/part-00012
output-18/part-00013
output-18/part-00014

好的，15个减速机应该生产15个零件x，正如我预期的那样。但是合并所有这些文件的最终结果（15个文件被拆分为1个文件）在哪里呢？我在hdfs目录中没有看到它。我应该得到我的文件字数计算文件，而不是15个文件，对吗？

Java hadoop hdfs mapreduce

来源：https://stackoverflow.com/questions/52025219/hadoop-mapreduce-wheres-the-final-hdfs-result-file-when-i-speficify-multiple-r