为什么hadoop不识别我的map类？

j2qf4p5b 于 2021-06-03 发布在 Hadoop

关注(0)|答案(1)|浏览(394)

我试图在hadoop 2.2.0上运行pdfwordcount map reduce程序，但出现以下错误：

13/12/25 23:37:26 INFO mapreduce.Job: Task Id : attempt_1388041362368_0003_m_000009_2, Status : FAILED
Error: java.lang.RuntimeException: java.lang.ClassNotFoundException: Class PDFWordCount$MyMap not found
    at org.apache.hadoop.conf.Configuration.getClass(Configuration.java:1720)
    at org.apache.hadoop.mapreduce.task.JobContextImpl.getMapperClass(JobContextImpl.java:186)
    at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:721)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:339)
    at org.apache.hadoop.mapred.YarnChild$2.run(YarnChild.java:162)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:415)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1491)
    at org.apache.hadoop.mapred.YarnChild.main(YarnChild.java:157)
Caused by: java.lang.ClassNotFoundException: Class PDFWordCount$MyMap not found
    at org.apache.hadoop.conf.Configuration.getClassByName(Configuration.java:1626)
    at org.apache.hadoop.conf.Configuration.getClass(Configuration.java:1718)
    ... 8 more

它说我的Map类是未知的。我有一个集群，在3个vm上有一个namenod和2个datanode。
我的主要职能是：

public static void main(String[] args) throws Exception {
    Configuration conf = new Configuration();
    @SuppressWarnings("deprecation")
    Job job = new Job(conf, "wordcount");

    job.setOutputKeyClass(Text.class);
    job.setOutputValueClass(IntWritable.class);

    job.setMapperClass(MyMap.class);
    job.setReducerClass(MyReduce.class);

    job.setInputFormatClass(PDFInputFormat.class);
    job.setOutputFormatClass(TextOutputFormat.class);

    FileInputFormat.addInputPath(job, new Path(args[0]));
    FileOutputFormat.setOutputPath(job, new Path(args[1]));

    job.setJarByClass(PDFWordCount.class);
    job.waitForCompletion(true);
  }

如果我使用以下命令运行jar：

yarn jar myjar.jar PDFWordCount /in /out

它需要 /in 作为输出路径并在 job.setJarByClass(PDFWordCount.class); 在我的主要职能，如你所见。
我运行了一个简单的wordcount项目，其main函数与这个main函数完全相同，为了运行它，我使用 yarn jar wc.jar MyWordCount /in2 /out2 它运行完美无瑕。
我不明白是什么问题！
更新：我试图将我的工作从这个项目转移到我成功使用的wordcount项目。我构建了一个包，将pdfwordcount项目中的相关文件复制到这个包中，并导出了这个项目（我的main没有更改为used） PDFInputFormat ，所以除了将java文件移到新包之外，我什么也没做。）它不起作用。我删除了其他项目的文件，但它没有工作。我把java文件移回了默认包，但没用！
怎么了？！

Java hadoop mapreduce RuntimeException

来源：https://stackoverflow.com/questions/20781120/why-hadoop-does-not-recognize-my-map-class

1条答案

按热度按时间

p3rjfoxz1#

我找到了克服这个问题的方法，尽管我不知道问题到底出在哪里。
当我想在eclipse中将java项目导出为jar文件时，我有两个选项：
Extract required libraries into generated JAR Package required libraries into generated JAR 我不知道到底有什么区别，或者这有没有什么大不了的。我以前选择第二个选项，但如果选择第一个选项，则可以使用以下命令运行作业：

yarn jar pdf.jar /in /out

赞(0）回复(0）举报 2021-06-03

我来回答

为什么hadoop不识别我的map类？

1条答案

相关问题

热门标签

最新问答