pandas 决策树分类器将浮点值视为数字数据,但需要是一种热编码数据类型

bgtovc5b  于 2023-03-28  发布在  其他
关注(0)|答案(1)|浏览(136)


I'正在对图片中的数据运行决策树分类器。在图片中,您可以看到,需要使用1和0进行热编码的数据类型(如时间签名和签名密钥)。然而,在dataframe中,所有0和1都是float类型。因此,我的决策树分类器无法区分是否存在特征,但是如果一个特征是有用的,则通过使用0.5进行分类,如第二张图所示。如何解决这个问题?
感谢已在进行中e

我已经试过把所有的float都转换成int,但还没有完全弄清楚怎么做

djmepvbi

djmepvbi1#

决策树不会通过检查某个特征是否存在来进行分类。树中使用的二进制值应该使用某个阈值(例如0.5)来分隔,这样,1将在一边,0将在另一边。
这是树的运作方式,没有bug。
下面是关于分类决策树的StatQuest:https://www.youtube.com/watch?v=_L39rN6gz7Y

相关问题