I'正在对图片中的数据运行决策树分类器。在图片中,您可以看到,需要使用1和0进行热编码的数据类型(如时间签名和签名密钥)。然而,在dataframe中,所有0和1都是float类型。因此,我的决策树分类器无法区分是否存在特征,但是如果一个特征是有用的,则通过使用0.5进行分类,如第二张图所示。如何解决这个问题?感谢已在进行中e
我已经试过把所有的float都转换成int,但还没有完全弄清楚怎么做
djmepvbi1#
决策树不会通过检查某个特征是否存在来进行分类。树中使用的二进制值应该使用某个阈值(例如0.5)来分隔,这样,1将在一边,0将在另一边。这是树的运作方式,没有bug。下面是关于分类决策树的StatQuest:https://www.youtube.com/watch?v=_L39rN6gz7Y
1条答案
按热度按时间djmepvbi1#
决策树不会通过检查某个特征是否存在来进行分类。树中使用的二进制值应该使用某个阈值(例如0.5)来分隔,这样,1将在一边,0将在另一边。
这是树的运作方式,没有bug。
下面是关于分类决策树的StatQuest:https://www.youtube.com/watch?v=_L39rN6gz7Y