在结构化流式处理来自Kafka主题的数据时指定检查点位置

tyg4sfes 于 2022-09-21 发布在 Kafka

关注(0)|答案(1)|浏览(211)

我已经构建了一个从Kafka主题读取数据的Spark结构化流应用程序，我已经将起始偏移量指定为最新，如果从Spark端出现任何故障会发生什么情况，重新启动后数据将从哪个点/偏移量继续读取，在写入流中指定检查点以确保我们从应用程序/Spark发生故障的点读取数据好吗？请让我知道。

来源：https://stackoverflow.com/questions/73739661/specifying-checkpoint-location-when-structured-streaming-the-data-from-kafka-top

1条答案

按热度按时间

你可以使用检查点，是的，或者你可以设置kafka.group.id(至少在Spark 3+中)。

否则，它可能会从主题的结尾处开始

赞(0）回复(0）举报 2022-09-21

相关问题

热门标签

Java query python Node 开发语言 request Util 数据库 Table 后端算法 Logger Message Element Parser

最新问答

xxl-job 安全组扫描到执行器端口服务存在信息泄露漏洞
回答(1) 发布于 6个月前
xxl-job 不能和nacos兼容？
回答(3) 发布于 6个月前
xxl-job 任务执行完后无法结束，日志一直转圈
回答(3) 发布于 5个月前
xxl-job-admin页面上查看调度日志样式问题
回答(1) 发布于 6个月前
xxl-job 参数512字符限制能否去掉
回答(1) 发布于 6个月前