aws使用HadoopAPI增加Map和缩减器

ig9co6j1  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(307)

我正在aws服务器上运行wordcount示例。我想测试我的输出并分析它们。我想增加Map器和还原器的数量,以及块的数量。
我怎样才能达到同样的效果?
创建作业时是否必须设置Map器/还原器的数量?或者我必须添加一些代码?我在用java。

bis0qfac

bis0qfac1#

可以在java程序的main函数中设置Map器和还原器的数量,该程序使用jobconf的 conf.setNumMapTasks(int num) 以及 conf.setNumRedTasks(int num) 分别是。
对于Map器,请注意api中的以下内容: "This is only a hint to the framework. The actual number of spawned map tasks depends on the number of InputSplits generated by the job's InputFormat.getSplits(JobConf, int). A custom InputFormat is typically used to accurately control the number of map tasks for the job." 显式设置输入块的数量有点困难。输入的拆分方式由 InputFormat 你使用和相应的 InputSplits 它使用的。如果您希望操纵输入拆分的方式,则必须自定义inputformat/inputsplits。

相关问题