hadoop mapreduce程序是否可以访问本地资源？

toiithl6 于 2021-05-30 发布在 Hadoop

关注(0)|答案(2)|浏览(318)

hadoop框架（或运行时）能否阻止（或约束）应用程序mapreduce程序访问本地资源（如本地文件系统）？
我想答案应该是对的，尤其是当mapreduce程序运行集群时。

hadoop

来源：https://stackoverflow.com/questions/27141993/is-it-possible-for-hadoop-mapreduce-programs-to-access-local-resource

2条答案

按热度按时间

41zrol4v1#

当然，mapreduce将在map/reduce阶段使用本地资源。
Map的输出将存储在本地文件系统中，然后进行填充和排序。
接下来，数据将被输入到reduce阶段。
在hadoopv1中，您可以指定本地路径的路径来存储map by属性的中间结果 mapred.local.dir hadoop v2，
从文件上看，
属性： mapreduce.cluster.local.dir 价值： ${hadoop.tmp.dir}/mapred/local 说明： The local directory where MapReduce stores intermediate data files. May be a comma-separated list of directories on different devices in order to spread disk i/o. Directories that do not exist are ignored. 希望有帮助！

赞(0）回复(0）举报 2021-05-30

l0oc07j22#

安全（kerberized）集群将在提交作业的用户下运行容器。普通的访问控制可以隔离这个用户对本地资源的访问。
非安全集群将容器作为nm运行（我说的是现代的Yarn集群，而不是1.x版本）。
最新的hadoop版本（2.6，即将发布）包含yarn-1964，它允许基于docker的容器。他们是完全孤立的（docker），但这是在2014年11月12日2.6承诺，所以是大约2周的成熟。你将生活在边缘。

赞(0）回复(0）举报 2021-05-30

我来回答

hadoop mapreduce程序是否可以访问本地资源？

2条答案

相关问题

热门标签

最新问答