我们可以使用下面的代码在PySpark中设置检查点目录路径:
spark.sparkContext.setCheckpointDir('/checkpoints')
因为SparkContext.getCheckpointDir()
只在PySpark版本3中引入。1.0,如何使用旧版本的PySpark(如v2)获取检查点目录路径。四点三?
我们可以使用下面的代码在PySpark中设置检查点目录路径:
spark.sparkContext.setCheckpointDir('/checkpoints')
因为SparkContext.getCheckpointDir()
只在PySpark版本3中引入。1.0,如何使用旧版本的PySpark(如v2)获取检查点目录路径。四点三?
2条答案
按热度按时间ev7lccsx1#
SparkContext.getCheckpointDir()
仅在PySpark版本3中实现。1.0,但幸运的是,它已经在v2.4.3
的底层Scala代码库中实现了。你可以在这里看到。您可以使用
_jsc
属性访问底层sparksession(JavaSparkContext)。以下代码在2.4.5
版本的pyspark REPL中工作:j13ufse22#
对于旧版本,您可以从conf中获取该属性: