如何合并这些n部分文件(pig操作的输出文件)。我必须将这些文件合并成一个文件,然后将其作为配置单元中的输入。我试过使用-cat和-getmerge,但没有成功。任何建议都会有帮助。谢谢
krcsximq1#
您可以按以下方式指定文件
A = LOAD '/hdfs/OUTPUT/ReliableProducts-r-*' using PigStorage('\t') as (Sid:int,Sname:chararray,Ttrading:chararray,Sloc:chararray,OBal:int,CBal:int,Frate:int);
希望这有帮助!!!
2w3kk1z52#
hadoop FileUtil 班级有一个 copyMerge 方法,可以很好地处理多个零件文件问题。它将接收您提供的文件夹中的所有文件(尽管不会递归地查看),并将它们连接起来以生成单个文件。
FileUtil
copyMerge
2条答案
按热度按时间krcsximq1#
您可以按以下方式指定文件
希望这有帮助!!!
2w3kk1z52#
hadoop
FileUtil
班级有一个copyMerge
方法,可以很好地处理多个零件文件问题。它将接收您提供的文件夹中的所有文件(尽管不会递归地查看),并将它们连接起来以生成单个文件。