ml决策树分类器的分类组合策略

liwlm1x9  于 2021-05-27  发布在  Spark
关注(0)|答案(0)|浏览(216)

我想训练一些 DecisionTreeClassifier 模型。输入数据集由连续的特征组成,这些特征的值可以从0到800,并且会不断增长。
我想了解 maxBins 参数起作用。尤其是它如何将特征的值与特定的bin相关联?
如果我保留 maxBins 参数设置为其默认值32,它会将0-800间隔划分为32个偶数范围,还是通过评估数据的分布方式来执行装箱?
假设特征值的分布是倾斜的,并且在0-50范围内有一个峰值,并且有一个朝向800的长尾,它是否会为0-50范围创建更多的箱子?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题