hadoop 2.7.3流jar无效

oiopk7p5  于 2021-05-29  发布在  Hadoop
关注(0)|答案(2)|浏览(443)

我对hadoop非常陌生,并试图用它运行一个简单的程序。
我已经将本地示例数据复制到hdfs,但是在我的map reduce作业中,当我按照官方apache文档运行这个命令时

  1. hadoop jar hadoop-streaming-2.7.3.jar \
  2. -input /user/hduser/gutenberg/* \
  3. -output /user/hduser/gutenberg-output \
  4. -mapper /home/hduser/mapper.py \
  5. -reducer /home/hduser/reducer.py

我得到这个错误
不是有效的jar:/usr/lib/hadoop-streaming-2.7.3.jar
请尽力帮助我。

pieyvz9o

pieyvz9o1#

hadoop流媒体jar的位置:
$hadoop\u home/share/hadoop/tools/lib/hadoop-streaming-2.7.1.2.4.2.0-258.jar
因为$hadoop\u的主页有时不一样。

dy2hfwbg

dy2hfwbg2#

它正在使用hadoop2.7.3
这是您需要运行的命令

  1. [Linux]$ hadoop jar \
  2. /usr/local/hadoop/share/hadoop/tools/lib/hadoop-streaming-2.7.3.jar \
  3. -file /home/python/mapper.py /home/python/reducer.py \
  4. -mapper "python mapper.py" \
  5. -reducer "python reducer1.py" \
  6. -input /tmp/word_i \
  7. -output /tmp/word_output

相关问题