Flink + connect dataStreams生成显示源中的巨大记录

hivapdat  于 2023-08-01  发布在  Apache
关注(0)|答案(1)|浏览(120)

我们使用upsert-kafka连接器从压缩的Kafka主题中消费数据,并使用.toChangelogStream将其转换为DataStream。我们使用kafka连接器从源Kafka创建了另一个DataStream。现在,我们正在从两者创建Keyed流,并使用KeyedCoProcessFunction实现连接它们。
在Flink UI中,我们在源Kafka操作符中看到了大量的记录,尽管我们没有那么多记录发布到该主题。当我避免.connect时,我可以在源操作符中看到更少的记录。


的数据
源流具有约50K个记录,压缩流具有约200个记录。在KeyedCoProcessFunction中,我们正在寻找一个公共键并发出所需的记录。
我错过了什么?有人能帮帮忙吗?

mcvgt66p

mcvgt66p1#

源代码或代码没有问题。Flink UI将这些操作组合起来,并将其显示为一个操作员。我更新了几个操作的并行度,然后UI显示了预期的数字。

相关问题