hadoop输出和流水线写入

tyu7yeag  于 2021-06-04  发布在  Hadoop
关注(0)|答案(1)|浏览(331)

几个问题:1。文件\字节\读取与hdfs \字节\读取之间的区别是什么。2当一个客户机准备写一个文件hdfs时,如果在将第一个块传递给第一个datanode时假设它是dn1,如果dn1失败,客户机仍然会写它或丢失它。名称节点在这个阶段是如何处理的?谢谢,s

jdgnovmf

jdgnovmf1#

我可以回答问题1
file_bytes_read:本地文件系统读取的字节数。假设所有map输入数据都来自hdfs,那么在map阶段它应该是零。另一方面,reducer的输入文件是reduce端本地磁盘上的数据,这些本地磁盘是从map端磁盘获取的。因此,它表示由缩减器读取的总字节数。
hdfs\u bytes\u read:读取的字节数:表示作业启动时Map程序从hdfs读取的字节数。这些数据不仅包括源文件的内容,还包括有关拆分的元数据。

相关问题