py4jjavaerror决策树预测

dgjrabp2 于 2021-05-18 发布在 Spark

关注(0)|答案(0)|浏览(389)

我正在尝试使用pyspark在数据集上应用决策树模型dataset:https://www.kaggle.com/c/customer-churn-prediction-2020/data?select=test.csv 代码：https://drive.google.com/file/d/1zjlghaxmqwa-nsjieutvk0kx_zpqupwh/view?usp=sharing
我在线路上有个错误 model = DecisionTree.trainClassifier(trainingData, numClasses=2,categoricalFeaturesInfo={1:2, 3:4, 4:2, 5:2},impurity='gini', maxDepth=5, maxBins=32) 错误是：

有人能告诉我们问题出在哪里，我该如何解决它吗？ps：我在另一个问题的另一个数据集中使用了相同的代码，它工作得非常好