map-reduce作业

exdqitrt 于 2021-06-03 发布在 Hadoop

关注(0)|答案(2)|浏览(503)

我跟随michaelnoll教程建立多节点集群并运行一个示例mapreduce程序。我正在安装hadoop版本2.2.0。hadoop2.2.0中没有contrib目录。我使用find命令从当前目录中搜索jar。搜索结果为

我的问题是如何在hadoop多节点集群环境下运行mapreduce程序？

2条答案

我们有一个4节点的hadoop-2.2.0集群。
可以使用以下命令从hadoop根文件夹（/usr/local/hadoop）的命令行运行wordcount测试：

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar wordcount /user/
hduser/in /user/hduser/out

注：

- folder name is different under hadoop: /share/hadoop/mapreduce/

我们创建了hduser/in文件夹（hdfs dfs-mkdir-p/user/hduser/in），复制了一个wordcount测试文件（hdfs dfs-copyfromlocal wc\u test.txt/user/hduser/in），并指定了一个输出文件夹（不应该存在）。

在多节点集群上运行mapreduce程序和在单个节点上运行mapreduce程序是一样的。中给出了运行0.23及更高版本（甚至2.2.0）的示例mapreduce程序的步骤link:learnig hadoop. 这里给出了wordcount程序。即使你可以用同一个jar运行pi估计器