重新启动Storm时，再次处理Kafka的所有预处理记录

uoifb46i 于 2022-12-09 发布在 Apache

关注(0)|答案(2)|浏览(222)

我正在从Kafka consumer阅读数据到Storm spout。但是，当我重新启动Storm时，它也会从Kafka读取以前处理过的记录。在重新启动时，我不想处理以前处理过的记录。下面是我的代码：

public class KafkaStormSample {
    public static void main(String[] args) throws Exception {

        SpoutConfig kafkaSpoutConfig = new SpoutConfig(hosts, topic, "/" + topic, UUID.randomUUID().toString());
        kafkaSpoutConfig.scheme = new SchemeAsMultiScheme(new StringScheme());

        TopologyBuilder builder = new TopologyBuilder();
        builder.setSpout("kafka-spout", new KafkaSpout(kafkaSpoutConfig));
        builder.setBolt("word-spitter", new SplitBolt()).shuffleGrouping("kafka-spout");

        LocalCluster cluster = new LocalCluster();
        cluster.submitTopology("KafkaStormSample", config, builder.createTopology());
    }
}

apache-storm

来源：https://stackoverflow.com/questions/57648820/processes-all-pre-processed-records-again-from-kafka-when-restart-storm