配置单元版本2.3
SET hive.exec.compress.output=true;
CREATED TABLE (
* ) STORED AS PARQUET
LOCATION 's3 location'
TBLPROPERTIES ('parquet.compress'='SNAPPY');
我在上面做了,但是s3位置的表输出没有压缩,我可以使用cat看到结果,我还尝试了'tblproperty('parquet.compress'='zlib');'那也没用。有人知道用Hive压缩Parquet地板最好的方法是什么吗?谢谢您。
1条答案
按热度按时间kadbb4591#
您还可以设置其他压缩格式。压缩列表
gzip-org.apache.hadoop.io.compress.gzip代码
bzip2-org.apache.hadoop.io.compress.bzip2编解码器
lzo-com.hadoop.compression.lzo.lzopcodec
snappy-org.apache.hadoop.io.compress.snappycodec
deflate-org.apache.hadoop.io.compress.deflatecodec
从上面的列表中,snappy不是默认值,deflatecodec是默认值。您可以通过运行