Flink SQL重复数据消除状态管理

uplii1fm  于 2022-12-09  发布在  Apache
关注(0)|答案(1)|浏览(183)

我有一个使用Table API消除重复数据的使用情形(当数据从一个源流到另一个接收器时)。This文档对于这样的用例看起来非常清楚。但是我不明白的是,在这种情况下状态管理是如何工作的?什么时候内部清理状态?例如,当我在几周后收到重复的order_id时,是否内部删除,因为它是重复的,但处理后14天?2或者换句话说,多久SQL清除它的状态?3这是没有提到在同一页,我试图理解。4也许我必须联系一些其他的概念?

2vuwiymt

2vuwiymt1#

除非明确定义,否则状态不会在内部清除https://nightlies.apache.org/flink/flink-docs-release-1.15/docs/dev/table/concepts/overview/#state-usage

相关问题