假设我有一个Kafka流窗口10分钟和1分钟的进展:
MyStream[K,V]
.groupByKey
.windowedBy(TimeWindows.of(Duration.ofMinutes(10)).advanceBy(Duration.ofMinutes(1))
.aggregate(myInitiator)(aggregator)(materializer)
.toStream
.to(OUTPUT_TOPIC)
这个流应该每1分钟输出一个值还是每10分钟输出一个值?
我每分钟都能看到消息。如何在提前1分钟进行聚合,然后使用输出在10分钟窗口(使用另一个函数)进行聚合,并每10分钟生成一条消息?我是否需要将第一个聚合的数据写入一个主题,然后在下一阶段使用另一个具有10分钟滚动窗口的流?
暂无答案!
目前还没有任何答案,快来回答吧!