Spark流检查点

gupuwyp2  于 2023-02-09  发布在  Apache
关注(0)|答案(1)|浏览(147)

我正在尝试实现spark流式检查点,使用GCS作为检查点的存储。启用检查点会导致作业的性能下降。只是想如果检查点可以在sql或其他存储上完成,这将比写入HDFS或GCS更快。

g6ll5ycj

g6ll5ycj1#

Spark 3.x(和之前的版本)不提供直接对SQL数据库进行检查点操作的原生支持,您必须对文件系统或分布式文件系统(如HDFS/GCS/S3)进行检查点操作。
话虽如此,您可以将自己的自定义检查点机制写入(然后检索)到不同的目的地。

相关问题