hadoop:如何计算实际文件大小?

wlp8pajw  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(457)

我正在使用hadoop来存储文件。我想知道实际的文件大小。

getFileSystem().getContentSummary(new Path(fileName)).getLength();

它返回压缩文件的大小。我使用默认的hadoop编解码器压缩。
如何计算实际文件大小?

xxhby3vn

xxhby3vn1#

除非压缩编解码器支持将未压缩的大小存储在压缩文件的页眉/页脚中,否则无法计算未压缩的大小(除了执行流解压缩并通过dd或java中的字节计数之类的方式运行)。
例如gzip—文件的最后4个字节是以字节为单位的未压缩大小(假设不超过4个字节)

相关问题