如何从java创建har(hadoop存档)？

xriantvc 于 2021-05-31 发布在 Hadoop

关注(0)|答案(1)|浏览(428)

我做rest服务，它必须在hadoop集群中创建har文件。其余部分在应用服务器上工作，而不是在hadoop集群中。为此，我使用org.apache.hadoop.tools.hadooparchives。但在创建hadooparchive对象时，我不知道如何设置集群。
hadooparchives har=新hadooparchives（conf）；
另一方面，当我尝试使用org.apache.hadoop.fs.fshell时，我使用next
fsshell=newshellinstance（）；
conf.set（“fs.defaultfs”，”hdfs://...");
shell.setconf（conf）；
一切都很顺利。
但我不明白同样的hadoop是如何实现的。
谢谢。

hadoop Har

来源：https://stackoverflow.com/questions/62734017/how-to-create-harhadoop-archive-from-java

1条答案

按热度按时间

yc0p9oo01#

你最好的选择是跑步 hadoop archive 命令作为外部进程（使用 ProcessBuilder 例如），并将配置作为 HADOOP_CONF 环境变量。否则，您将不得不编写一个mapreduce作业并直接从rest服务启动它，这将非常复杂。 HadoopArchives 本质上是一个命令行实用程序，而不是设计为用作库。

赞(0）回复(0）举报 2021-05-31

我来回答

如何从java创建har(hadoop存档)？

1条答案

相关问题

热门标签

最新问答