我正在尝试使用pyspark在数据集上应用决策树模型dataset:https://www.kaggle.com/c/customer-churn-prediction-2020/data?select=test.csv 代码:https://drive.google.com/file/d/1zjlghaxmqwa-nsjieutvk0kx_zpqupwh/view?usp=sharing
我在线路上有个错误 model = DecisionTree.trainClassifier(trainingData, numClasses=2,categoricalFeaturesInfo={1:2, 3:4, 4:2, 5:2},impurity='gini', maxDepth=5, maxBins=32)
错误是:
有人能告诉我们问题出在哪里,我该如何解决它吗?ps:我在另一个问题的另一个数据集中使用了相同的代码,它工作得非常好
暂无答案!
目前还没有任何答案,快来回答吧!