我的最终目标是将每个reducer的orc输出溢出到它自己的文件夹中,使几个外部表存储为orc。我在试着复制这个http://hadoopathome.logdown.com/posts/277986-using-multipleoutputs-with-orc-in-mapreduce 而且似乎不起作用。输出既不会拆分到文件夹,也不会生成正确的文件。
我用文本输出测试了multipleoutputs,用context.write()测试了newoutputformat,效果很不错。有人用过这种组合吗?
Hive为0.14.0。hadoop 2.6.0版
暂无答案!
目前还没有任何答案,快来回答吧!