mapreduce-examples.jar输出在哪里?

6yjfywim  于 2021-06-02  发布在  Hadoop
关注(0)|答案(2)|浏览(375)

我在hdinsight中运行了示例wordcount应用程序,命令运行成功,但找不到输出。我执行的命令是

hadoop jar hadoop-mapreduce-examples.jar wordcount /example/data/gutenberg/davinci.txt /user/joe/WordCountOutput

我希望在文件系统上创建一些东西。但我不明白 /user/joe/ 创建。
请给我建议。

ni65a41a

ni65a41a1#

hdinsight默认使用azure blob存储作为其hdfs存储,因此您的输出位于与集群关联的存储帐户中。您可以使用cloudxplorer之类的工具轻松读取blob存储帐户并查找这些数据。它将位于/user/joe/wordcountoutput下的默认wabs容器中
您还可以像这样运行命令,以便对输出位置有更多的控制

hadoop jar hadoop-mapreduce-examples.jar wordcount /example/data/gutenberg/davinci.txt wabs://<contatiner>@<storageaccount>.blob.core.windows.net/user/joe/WordCountOutput
ecfsfe2w

ecfsfe2w2#

它不在您计算机的文件系统中,而是在azure Blob上。通常,hadoopmapreduce使用hadoopdistributedfilesystem(hdfs),但是正如thomasjungblut在评论中正确指出的那样,azure blobs已经完全取代了hdinsight中的hdfs。不过,您应该能够使用hdfs shell命令访问输出,如:

hadoop dfs -ls /user/jow/WordCountOutput

也许hdinsight提供了更多的方法来浏览这个文件系统(请参阅andrew moll的答案),但我并不熟悉它们,实际上这已经相当容易了。

相关问题