如果我有两个输入文件夹,每个文件夹包含100个输入文件,我就使用map side join。我想知道hadoop将创建多少Map器任务。当我们使用map-side-join时,hadoop如何分割输入文件。
jw5wzhpr1#
Map边连接每边正好100个文件将产生100个Map任务。
1条答案
按热度按时间jw5wzhpr1#
Map边连接每边正好100个文件将产生100个Map任务。