我想训练一些 DecisionTreeClassifier
模型。输入数据集由连续的特征组成,这些特征的值可以从0到800,并且会不断增长。
我想了解 maxBins
参数起作用。尤其是它如何将特征的值与特定的bin相关联?
如果我保留 maxBins
参数设置为其默认值32,它会将0-800间隔划分为32个偶数范围,还是通过评估数据的分布方式来执行装箱?
假设特征值的分布是倾斜的,并且在0-50范围内有一个峰值,并且有一个朝向800的长尾,它是否会为0-50范围创建更多的箱子?
我想训练一些 DecisionTreeClassifier
模型。输入数据集由连续的特征组成,这些特征的值可以从0到800,并且会不断增长。
我想了解 maxBins
参数起作用。尤其是它如何将特征的值与特定的bin相关联?
如果我保留 maxBins
参数设置为其默认值32,它会将0-800间隔划分为32个偶数范围,还是通过评估数据的分布方式来执行装箱?
假设特征值的分布是倾斜的,并且在0-50范围内有一个峰值,并且有一个朝向800的长尾,它是否会为0-50范围创建更多的箱子?
暂无答案!
目前还没有任何答案,快来回答吧!