我想知道有多少文件将产生,如果只有一个单一的Map器(没有减少,没有组合器等)是所有文件分裂运行。示例-如果有4个文件拆分。然后有一个Map器将处理所有文件分割。Map器输出多少个文件??->一个或四个
nhjlsmyf1#
每个Map任务将生成一个输出文件。如果hdfs上有一个文件被拆分为四个块,那么将从仅Map作业中获得四个输出文件。如果输入文件不是可拆分的格式,比如gzip,那么它将被合并,并且只有一个Map器对其进行操作,输出一个文件。
1条答案
按热度按时间nhjlsmyf1#
每个Map任务将生成一个输出文件。如果hdfs上有一个文件被拆分为四个块,那么将从仅Map作业中获得四个输出文件。如果输入文件不是可拆分的格式,比如gzip,那么它将被合并,并且只有一个Map器对其进行操作,输出一个文件。