我对hadoop非常陌生,并试图用它运行一个简单的程序。
我已经将本地示例数据复制到hdfs,但是在我的map reduce作业中,当我按照官方apache文档运行这个命令时
hadoop jar hadoop-streaming-2.7.3.jar \
-input /user/hduser/gutenberg/* \
-output /user/hduser/gutenberg-output \
-mapper /home/hduser/mapper.py \
-reducer /home/hduser/reducer.py
我得到这个错误
不是有效的jar:/usr/lib/hadoop-streaming-2.7.3.jar
请尽力帮助我。
2条答案
按热度按时间pieyvz9o1#
hadoop流媒体jar的位置:
$hadoop\u home/share/hadoop/tools/lib/hadoop-streaming-2.7.1.2.4.2.0-258.jar
因为$hadoop\u的主页有时不一样。
dy2hfwbg2#
它正在使用hadoop2.7.3
这是您需要运行的命令