我正在尝试理解joinwindows.of和joinwindows.until之间的区别,同时执行左连接。例如
Stream1.leftJoin(Stream2,SomeJoinerValue,joinWindows.of(2 mins).until(5 mins))
我的理解是,根据文档,只要stream1和stream2之间的时间差小于2分钟,就可以在不从流中删除任何内容的情况下执行成功的连接。
我的问题是,5分钟的windows保留期有什么用?
我正在尝试理解joinwindows.of和joinwindows.until之间的区别,同时执行左连接。例如
Stream1.leftJoin(Stream2,SomeJoinerValue,joinWindows.of(2 mins).until(5 mins))
我的理解是,根据文档,只要stream1和stream2之间的时间差小于2分钟,就可以在不从流中删除任何内容的情况下执行成功的连接。
我的问题是,5分钟的windows保留期有什么用?
1条答案
按热度按时间djmepvbi1#
窗口保留期是保持窗口并接受新输入数据的方式的下限。这是处理无序记录所必需的。联接是基于事件时间的,因此不能保证所有记录都按时间戳顺序处理。事实上,kafka以偏移顺序处理记录。