在使用sqoop的情况下,mapper输出是如何写入hdfs的?

ldxq2e6h  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(297)

正如我了解到的hadoop map reduce作业,mapper输出被写入本地存储,而不是hdfs,因为它最终是一个一次性的数据,所以没有必要存储在hdfs中。
但正如我在sqoopMap器输出文件中看到的那样 part-m-00000 写入hdfs。所以我的疑问是hadoop中是否有一些设置来控制Map器输出的写入位置?默认设置为本地存储?

kiz8lqtg

kiz8lqtg1#

如果没有还原器,那么Map器输出将写入hdfs。即使在这种情况下,Map器输出也不会直接写入hdfs,而是写入单个节点磁盘,然后复制到hdfs。
sqoop是一种场景,其中它通常是一个仅Map的作业,您希望并行地从表中获取数据,但在任何情况下都不需要减少数据。
检查此链接:标识减速机与零减速机

相关问题