hadoop mapreduce程序是否可以访问本地资源?

toiithl6  于 2021-05-30  发布在  Hadoop
关注(0)|答案(2)|浏览(319)

hadoop框架(或运行时)能否阻止(或约束)应用程序mapreduce程序访问本地资源(如本地文件系统)?
我想答案应该是对的,尤其是当mapreduce程序运行集群时。

41zrol4v

41zrol4v1#

当然,mapreduce将在map/reduce阶段使用本地资源。
Map的输出将存储在本地文件系统中,然后进行填充和排序。
接下来,数据将被输入到reduce阶段。
在hadoopv1中,您可以指定本地路径的路径来存储map by属性的中间结果 mapred.local.dir hadoop v2,
从文件上看,
属性: mapreduce.cluster.local.dir 价值: ${hadoop.tmp.dir}/mapred/local 说明: The local directory where MapReduce stores intermediate data files. May be a comma-separated list of directories on different devices in order to spread disk i/o. Directories that do not exist are ignored. 希望有帮助!

l0oc07j2

l0oc07j22#

安全(kerberized)集群将在提交作业的用户下运行容器。普通的访问控制可以隔离这个用户对本地资源的访问。
非安全集群将容器作为nm运行(我说的是现代的Yarn集群,而不是1.x版本)。
最新的hadoop版本(2.6,即将发布)包含yarn-1964,它允许基于docker的容器。他们是完全孤立的(docker),但这是在2014年11月12日2.6承诺,所以是大约2周的成熟。你将生活在边缘。

相关问题