java—如何在hadoop级联中获取输入文件名

a6b3iqyw 于 2021-06-03 发布在 Hadoop

关注(0)|答案(3)|浏览(461)

在map reduce中，我将提取输入文件名，如下所示

public void map(WritableComparable<Text> key, Text value, OutputCollector<Text,Text> output, Reporter reporter)
        throws IOException {

      FileSplit fileSplit = (FileSplit)reporter.getInputSplit();
      String filename = fileSplit.getPath().getName();
      System.out.println("File name "+filename);
      System.out.println("Directory and File name"+fileSplit.getPath().toString());

    process(key,value);

}

如何使用级联实现类似的功能

Pipe assembly = new Pipe(SomeFlowFactory.class.getSimpleName());
Function<Object> parseFunc = new SomeParseFunction();
assembly = new Each(assembly, new Fields(LINE), parseFunc);
...

public class SomeParseFunction extends BaseOperation<Object> implements Function<Object> {
...

 @Override
    public void operate(FlowProcess flowProcess, FunctionCall<Object> functionCall) {

how can I get the input file name here ???    
}

谢谢，

Java hadoop mapreduce cascading

来源：https://stackoverflow.com/questions/13791524/how-to-get-input-file-name-in-hadoop-cascading

3条答案

按热度按时间

gywdnpxw1#

您可以通过从buffer operate调用中提供的flowprocess参数获取buffer类中的reporter来实现这一点。

HadoopFlowProcess hfp = (HadoopFlowProcess) flowprocess; 

FileSplit fileSplit = (FileSplit)hfp.getReporter().getInputSplit();
.
.//the rest of your code
.

赞(0）回复(0）举报 2021-06-04

2admgd592#

我不使用级联，但我认为使用functioncall.getcontext（）访问上下文示例就足够了，以获得可以使用的文件名：

String filename= ((FileSplit)context.getInputSplit()).getPath().getName();

但是，级联似乎使用了旧的api，如果上面的api不起作用，您必须尝试：

Object name = flowProcess.getProperty( "map.input.file" );

赞(0）回复(0）举报 2021-06-04

7gcisfzg3#

感谢engineiro分享答案。然而，当调用hfp.getreporter（）.getinputsplit（）方法时，我得到了multiinputsplit类型，它不能在级联2.5.3中直接转换为filesplit类型。在深入研究了相关的级联api之后，我找到了一种方法并成功地检索了输入文件名。因此，我想分享这一点，以补充engineiro的答案。请参阅以下代码。

HadoopFlowProcess hfp = (HadoopFlowProcess) flowProcess;
MultiInputSplit mis = (MultiInputSplit) hfp.getReporter().getInputSplit();
FileSplit fs = (FileSplit) mis.getWrappedInputSplit();
String fileName = fs.getPath().getName();

赞(0）回复(0）举报 2021-06-03

我来回答

java—如何在hadoop级联中获取输入文件名

3条答案

相关问题

热门标签

最新问答