hadoop-作为Map器输出生成的输出文件数

a11xaf1n  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(355)

我想知道有多少文件将产生,如果只有一个单一的Map器(没有减少,没有组合器等)是所有文件分裂运行。
示例-如果有4个文件拆分。然后有一个Map器将处理所有文件分割。Map器输出多少个文件??->一个或四个

nhjlsmyf

nhjlsmyf1#

每个Map任务将生成一个输出文件。如果hdfs上有一个文件被拆分为四个块,那么将从仅Map作业中获得四个输出文件。如果输入文件不是可拆分的格式,比如gzip,那么它将被合并,并且只有一个Map器对其进行操作,输出一个文件。

相关问题