我们使用upsert-kafka
连接器从压缩的Kafka主题中消费数据,并使用.toChangelogStream
将其转换为DataStream。我们使用kafka
连接器从源Kafka创建了另一个DataStream。现在,我们正在从两者创建Keyed流,并使用KeyedCoProcessFunction
实现连接它们。
在Flink UI中,我们在源Kafka操作符中看到了大量的记录,尽管我们没有那么多记录发布到该主题。当我避免.connect
时,我可以在源操作符中看到更少的记录。
的数据
源流具有约50K个记录,压缩流具有约200个记录。在KeyedCoProcessFunction
中,我们正在寻找一个公共键并发出所需的记录。
我错过了什么?有人能帮帮忙吗?
1条答案
按热度按时间mcvgt66p1#
源代码或代码没有问题。Flink UI将这些操作组合起来,并将其显示为一个操作员。我更新了几个操作的并行度,然后UI显示了预期的数字。