在pig中合并部分文件

fcwjkofz  于 2021-06-02  发布在  Hadoop
关注(0)|答案(2)|浏览(332)

如何合并这些n部分文件(pig操作的输出文件)。我必须将这些文件合并成一个文件,然后将其作为配置单元中的输入。我试过使用-cat和-getmerge,但没有成功。任何建议都会有帮助。
谢谢

krcsximq

krcsximq1#

您可以按以下方式指定文件

A = LOAD '/hdfs/OUTPUT/ReliableProducts-r-*' using PigStorage('\t') as (Sid:int,Sname:chararray,Ttrading:chararray,Sloc:chararray,OBal:int,CBal:int,Frate:int);

希望这有帮助!!!

2w3kk1z5

2w3kk1z52#

hadoop FileUtil 班级有一个 copyMerge 方法,可以很好地处理多个零件文件问题。
它将接收您提供的文件夹中的所有文件(尽管不会递归地查看),并将它们连接起来以生成单个文件。

相关问题