ApacheKafka—在flink中连接历史数据时,一个源代码比另一个源代码慢得多

l0oc07j2  于 2021-06-04  发布在  Kafka
关注(0)|答案(1)|浏览(353)

当使用带有eventtime的join操作符中的历史数据时,从一个源读取数据要比从另一个源读取数据慢得多。因此,join操作符将缓存来自速度较快的源的大量数据,以便等待速度较慢的源。
问题是,我如何才能使消费者的速度差异变小?

z4bn682m

z4bn682m1#

我不太明白你所说的“让消费者的速度差别变小”是什么意思。如果您想避免缓存大量数据,并且无法控制源速度,那么我认为您唯一的选择是使用较小的窗口,以便缓存较少的数据。有关详细信息,请参见窗口连接。

相关问题