缓存—在mapreduce hadoop中将uri作为运行时变量传递给分布式缓存

kxkpmulp  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(246)

我在mapreduce程序中使用分布式缓存,并将三个变量传递给这个mapreduce程序 input file , output dir 以及 config file .
我想在分布式缓存中添加第三个参数,即config文件。
我正在设置参数,如下所示 run() mapreduce方法driver:-

conf.set("CONF_XML", args[2]);

如何以相同的方法将此文件添加到分布式缓存中。我该怎么做?
通常我们使用 URI(new (file path)); ```
DistributedCache.addCacheFile(new URI(file_path), conf); << here how to pass the argument parameter?

mnemlml8

mnemlml81#

将文件路径参数作为uri传递给distributedcache api
distributedcache.addcachefile(新路径(args[2]).touri(),job.getconfiguration());

相关问题