我正在使用汇合hdfs接收器连接器,我正在以avro格式插入数据。
我想使用snappy压缩来压缩数据。
Kafka:confluent的hdfs连接器支持快速压缩吗?我使用了上面提到的解决方案
我添加了配置
avro.codec=快速
但是,它并没有像在中那样对我起作用,创建的文件没有使用snappy压缩进行压缩。通常,当我运行spark作业时,我的文件会附加.snappy文件扩展名,但在本例中,我看不到这种情况发生。我假设我的文件没有被snappy压缩。
有没有其他配置我遗漏了?
我正在使用汇合hdfs接收器连接器,我正在以avro格式插入数据。
我想使用snappy压缩来压缩数据。
Kafka:confluent的hdfs连接器支持快速压缩吗?我使用了上面提到的解决方案
我添加了配置
avro.codec=快速
但是,它并没有像在中那样对我起作用,创建的文件没有使用snappy压缩进行压缩。通常,当我运行spark作业时,我的文件会附加.snappy文件扩展名,但在本例中,我看不到这种情况发生。我假设我的文件没有被snappy压缩。
有没有其他配置我遗漏了?
1条答案
按热度按时间6za6bjd01#
如果你有avro工具可用,你可以用它来检查文件
还有一个十六进制编辑器
要将文件转换为非snappy avro文件,可以使用
recodec
avro工具。