使用pandas.cut()时,将数字特征转换为分类装箱特征非常简单。但是,如果您想通过将装箱对象特征转换为数字分类特征(1、2、3、4等)来实现相反的目的,那么最简单的方法是什么?
独特的装箱类别:["0-9%", "10-19%", "20-29%", "30-39%", "40-49%", "50-59%", etc...]
为了解决这个问题,有很多方法都是幼稚的。E、 g,使用if语句运行for循环:
temp = []
for i in list1:
if i == "0-9%":
temp.append(1)
elif i == "10-19%":
temp.append(2)
elif i == "20-29%":
temp.append(3)
etc......
或者创建一个字典,将每个不同的binned类别作为关键字,并将其索引值用作值:
temp = {}
for v, k in enumerate(pd.unique(list1)):
temp[k] = v+1 # +1 just to skip first value 0
list1 = [temp[bin] for bin in list1]
然而,这两种方法感觉有点幼稚,我很好奇是否有更简单的方法来解决这个问题?
2条答案
按热度按时间mxg2im7a1#
类别中已经有数字信息。
使用
cat.codes
访问它:输出:
如果输入不是Categorical,则需要使用
factorize
。4nkexdtk2#
创建一个字典,显示当前bin和要将其转换为的数字,然后使用replace函数