pyspark.ml decisiontreeclassifier的再现性

6bc51xsx 于 2021-05-27 发布在 Spark

关注(0)|答案(0)|浏览(293)

我有一个与 DecisionTreeClassifier 函数来自 PySpark.ML . 当设置树函数时，每次决策树拟合时，我都会传递相同的随机种子。但是，当我关闭spark上下文并重新加载进程时，生成的决策树是不同的。
我有一些理解，由于性质的Spark的分布式系统，但我正在寻找一种方法，以确保再现性。到目前为止，我所做的努力包括加载一个未分区的表和缓存sparkDataframe。

apache-spark pyspark decision-tree

来源：https://stackoverflow.com/questions/62764360/reproducibility-with-pyspark-ml-decisiontreeclassifier

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

pyspark.ml decisiontreeclassifier的再现性

暂无答案！

相关问题

热门标签

最新问答