淹没Kafka原木

xuo3flqw  于 2021-06-06  发布在  Kafka
关注(0)|答案(1)|浏览(373)

我正在使用kafka流,我注意到它让我的kafka记录了很多日志消息,例如:

[2019-04-17 09:06:16,541] INFO [Log partition=my-application-KSTREAM-AGGREGATE-STATE-STORE-0000000076-repartition-0, dir=/opt/kafka/data/logs] Incrementing log start offset to 316423 (kafka.log.Log) [2019-04-17 09:06:16,545] INFO [Log partition=my-application-KSTREAM-AGGREGATE-STATE-STORE-0000000033-repartition-2, dir=/opt/kafka/data/logs] Incrementing log start offset to 3394 (kafka.log.Log) 
[2019-04-17 09:06:16,546] INFO [Log partition=my-application-KSTREAM-AGGREGATE-STATE-STORE-0000000012-repartition-1, dir=/opt/kafka/data/logs] Incrementing log start offset to 3102 (kafka.log.Log) 
[2019-04-17 09:06:16,549] INFO [Log partition=my-application-KSTREAM-AGGREGATE-STATE-STORE-0000000067-repartition-3, dir=/opt/kafka/data/logs] Incrementing log start offset to 4168 (kafka.log.Log) 
[2019-04-17 09:06:16,551] INFO [Log partition=my-application-KSTREAM-AGGREGATE-STATE-STORE-0000000086-repartition-3, dir=/opt/kafka/data/logs] Incrementing log start offset to 329670 (kafka.log.Log)

这真是令人不安,因为它淹没了日志,所以我看不到任何其他内容(也消耗资源)。
为什么Kafka的一些内部主题会发生这种情况,而其他主题却不会?
如何禁用它?

hsgswve4

hsgswve41#

kafka streams在处理数据后积极清除重新分区主题,以释放kafka集群中的存储空间(cf。https://issues.apache.org/jira/browse/kafka-6150). 无法禁用此功能。
作为解决方法,您可以重新配置重新分区主题配置参数 segment.bytes 以及 segment.ms 并将其设置为更高的值。请注意,这会降低数据清除的效率,但会导致kafka集群中使用更多磁盘。

相关问题