apacheflink:如何在流应用程序中存储中介数据

y1aodyip  于 2021-06-25  发布在  Flink
关注(0)|答案(1)|浏览(289)

我正在用flink的datastreamapi实现misragries算法。它保持 k 按增量或减量记录数据摘要的计数器。
在使用datastreamapi实现算法时,存储此类计数器的最佳方法是什么?现在我宣布 HashMap 运算符中的变量。这是正确的方法还是我需要使用其他一些特性,比如state?

9bfwbjaz

9bfwbjaz1#

您应该将计数器存储在flink的托管状态,即keyed状态或operator状态,并启用检查点。否则,如果发生故障,信息将丢失。
如果正确使用了状态并启用了检查点,flink会定期检查应用程序的状态。如果出现故障,将重新启动作业,并将其状态重置为最新的检查点。

相关问题