我已经在UbuntuLinux15.04中安装了Hadoop2.6,运行良好。但是,当我运行一个示例测试mapreduce程序时,它会给出以下错误:
org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: hdfs://localhost:54310/user/hduser/input.
请帮帮我。下面是错误的完整细节。
hduser@krishadoop:/usr/local/hadoop/sbin$ hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar wordcount input output
Picked up JAVA_TOOL_OPTIONS: -javaagent:/usr/share/java/jayatanaag.jar
15/08/24 15:22:37 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
15/08/24 15:22:38 INFO Configuration.deprecation: session.id is deprecated. Instead, use dfs.metrics.session-id
15/08/24 15:22:38 INFO jvm.JvmMetrics: Initializing JVM Metrics with processName=JobTracker, sessionId=
15/08/24 15:22:39 INFO mapreduce.JobSubmitter: Cleaning up the staging area file:/app/hadoop/tmp/mapred/staging/hduser1122930879/.staging/job_local1122930879_0001
org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: hdfs://localhost:54310/user/hduser/input
at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:321)
at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.listStatus(FileInputFormat.java:264)
at org.apache.hadoop.mapreduce.lib.input.FileInputFormat.getSplits(FileInputFormat.java:385)
at org.apache.hadoop.mapreduce.JobSubmitter.writeNewSplits(JobSubmitter.java:597)
at org.apache.hadoop.mapreduce.JobSubmitter.writeSplits(JobSubmitter.java:614)
at org.apache.hadoop.mapreduce.JobSubmitter.submitJobInternal(JobSubmitter.java:492)
at org.apache.hadoop.mapreduce.Job$10.run(Job.java:1296)
at org.apache.hadoop.mapreduce.Job$10.run(Job.java:1293)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:415)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1628)
at org.apache.hadoop.mapreduce.Job.submit(Job.java:1293)
at org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:1314)
at org.apache.hadoop.examples.WordCount.main(WordCount.java:87)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:606)
at org.apache.hadoop.util.ProgramDriver$ProgramDescription.invoke(ProgramDriver.java:71)
at org.apache.hadoop.util.ProgramDriver.run(ProgramDriver.java:144)
at org.apache.hadoop.examples.ExampleDriver.main(ExampleDriver.java:74)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:606)
at org.apache.hadoop.util.RunJar.run(RunJar.java:221)
at org.apache.hadoop.util.RunJar.main(RunJar.java:136)
8条答案
按热度按时间j8ag8udp1#
程序无法找到输入的hadoop路径。它搜索的是本地系统文件,而不是hadoop的dfs。
当您的程序能够定位hdfs位置时,这个问题就会消失。我们需要让程序理解配置文件中给出的hdfs位置。为此,请在程序代码中添加这些行。
ndasle7k2#
当您使用输入和输出文件/目录编译任何jar文件时,您应该确保输入文件已经创建(在指定的路径中)并且输出文件不存在。
如果要将文本文件作为输入文件,请首先将文本文件从本地文件系统复制到hdfs,然后使用以下命令进行编译
/input.txt可以替换为任何文本文件的地址。
pbossiut3#
在执行hadoop作业之前,必须创建并上载输入。例如,如果你需要上传
input.txt
文件,则应执行以下操作:第一行创建目录,另一行将输入文件上载到hdfs(hadoop fylesystem)中。
v9tzhpje4#
如果你发现
/bin/bash: /bin/java: No such file or directory
在日志中,尝试在/etc/hadoop/hadoop-env.sh中设置java\u homelsmepo6l5#
您应该在hdfs中创建目录:例如,“hadoopfs-mkdir/input\u dir”
然后运行mapreduce程序。你应该提到输入目录的绝对路径,所以格式应该是:
hadoop jar jarFileName.jar className /input_dir /outputdir
正确的以下是错误的,因为它是相对路径
hadoop jar jarFileName.jar className input_dir outputdir
错误的zbsbpyhn6#
如果您在物理上看到这个路径(文件)并且仍然得到错误,那么您可能会与本地文件系统和hadoop分布式文件系统(hdfs)混淆。为了运行这个map reduce,这个文件应该位于hdfs中(只在本地文件系统中定位是不行的)。
您可以通过此命令将本地文件系统文件导入hdfs。
通过此命令确认导入的文件存在于hdfs中。
x4shl7ld7#
您需要在本地模式下启动pig,而不是群集节点:
pig-x本地
llew8vvj8#
好像你提到了一个错误的输入路径。hadoop正在以下位置搜索输入路径:
/user/hduser/input
. hadoop也遵循类似unix的树结构。如果你只提到一个目录input
它将被视为/user/{username}/input
.