更改mapred.reduce.tasks

kmbjn2e3  于 2021-05-29  发布在  Hadoop
关注(0)|答案(2)|浏览(373)

我应该在哪个文件中设置减速器的数量和 mapred.reduce.tasks 参数?
我的电脑里只有以下文件 conf 文件夹,但没有一个具有此参数:

ubuntu@group-3-vm1:~/conf$ ls
capacity-scheduler.xml  hdfs-site.xml  mapred-site.xml  yarn-site.xml
core-site.xml           hive-site.xml  tez-site.xml
ergxz8rk

ergxz8rk1#

更新:
您可以指定 mapred.reduce.tasks 导入mapred-site.xml。这将为hadoop安装程序上运行的所有作业设置配置。在我看来,这不是个好主意。
理想情况下,减速机数量可根据工作需要设置。您可以使用下面提供的选项来执行此操作。
数量 Reducer 在运行/启动hadoop作业时,可以通过命令行在中设置。

hadoop jar <main_jar.jar> Main_class -D mapred.reduce.tasks=<number_of_reducers>

另一种方式是,在你的 Driver 班级进入 Job 配置。

job.setNumReduceTasks(number_of_reducers);

不需要设置属性 (mapred.reduce.tasks) 在任何配置文件中。默认值为1。
如果您使用的是hadoop2,那么最好使用 mapreduce.job.reduces 而不是 mapred.reduce.tasks .

csga3l58

csga3l582#

所有hadoop配置属性都分为以下组。
hadoop-1.x.x版本:
core-core-site.xml
hdfs-hdfs-site.xml
mapred-mapred-site.xml
hadoop-2.x.x版本
core-core-site.xml
hdfs-hdfs-site.xml
mapreduce-mapred-site.xml
Yarn-Yarn-site.xml
所以你想改变reducer的数量,也就是mapred.reduce.tasks。必须将此参数保存在“mapred site.xml”文件中。

相关问题