如何使用multipleoutputs格式生成自定义文件名并生成其他文件

s5a0g9ez  于 2021-06-01  发布在  Hadoop
关注(0)|答案(0)|浏览(339)

我正在使用multipleoutputs格式编写orc文件,以创建自定义文件名。我正在设置驱动程序如下

MultipleOutputs.addNamedOutput(job, "MyPrefix", OrcNewOutputFormat.class, NullWritable.class, Writable.class);

异径管,如下所示
设置:

_multipleOutputs = new MultipleOutputs<NullWritable, Writable>(context);

还原方法:

_multipleOutputs.write("MyPrefix", NullWritable.get(), row);

清理方法:

_multipleOutputs.close();

虽然对于有前缀“myprefix”生成的数据的文件,但是也生成了没有记录的第00000部分文件。
请让我知道如何停止生成名为part-00000的空文件。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题