hadoop—如何在hdfs中压缩文件而不将其拉入本地文件系统

tyu7yeag  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(248)

是否可以在hdfs中压缩文件而不将其拉入本地系统驱动器?我通常通过做一个 hadoop fs -get filename 然后通过linuxzip命令压缩它…但是我能在hdfs本身中做这个吗?

mhd8tkvw

mhd8tkvw1#

可以使用identity mapper(输出与输入相同)而不是reducer创建mapreduce作业;配置要压缩的Map器输出。我想建议使用gzip或lzo代替zip格式,但只有你知道你的要求。

相关问题