我想发现我的特征和目标之间的潜在模式,所以我尝试使用groupby,但我想计算的不是计数,而是每个类的计数占总数的比率或百分比,下面的代码与我所做的工作类似。
fet1=["A","B","C"]
fet2=["X","Y","Z"]
target=["0","1"]
df = pd.DataFrame(data={"fet1":np.random.choice(fet1,1000),"fet2":np.random.choice(fet2,1000),"class":np.random.choice(target,1000)})
df.groupby(['fet1','fet2','class'])['class'].agg(['count'])
2条答案
按热度按时间pexxcrt21#
您可以通过以下方式更简单地实现这一点:
输出量:
如果您希望多索引的顺序相同:
输出量:
i2loujxw2#
我是这样做的