正如我了解到的hadoop map reduce作业,mapper输出被写入本地存储,而不是hdfs,因为它最终是一个一次性的数据,所以没有必要存储在hdfs中。但正如我在sqoopMap器输出文件中看到的那样 part-m-00000 写入hdfs。所以我的疑问是hadoop中是否有一些设置来控制Map器输出的写入位置?默认设置为本地存储?
part-m-00000
kiz8lqtg1#
如果没有还原器,那么Map器输出将写入hdfs。即使在这种情况下,Map器输出也不会直接写入hdfs,而是写入单个节点磁盘,然后复制到hdfs。sqoop是一种场景,其中它通常是一个仅Map的作业,您希望并行地从表中获取数据,但在任何情况下都不需要减少数据。检查此链接:标识减速机与零减速机
1条答案
按热度按时间kiz8lqtg1#
如果没有还原器,那么Map器输出将写入hdfs。即使在这种情况下,Map器输出也不会直接写入hdfs,而是写入单个节点磁盘,然后复制到hdfs。
sqoop是一种场景,其中它通常是一个仅Map的作业,您希望并行地从表中获取数据,但在任何情况下都不需要减少数据。
检查此链接:标识减速机与零减速机