在这种情况下,我需要所有用户,谁有超过total_noise_sent > 5
的地方总结,我不明白我应该如何做在我的代码,在那里我分组或做它在图形的代码
graph_noise = df.groupby(['total_noise_sent','gr']).agg({'uid':'count'})
graph_noise = graph_noise.reset_index()
sb.barplot(x="total_noise_sent", y="uid", hue="gr", data=graph_noise)
plt.show()
2条答案
按热度按时间huwehgph1#
在您的数据框架中,您可以将所有超过5的值替换为另一个值,例如“>5”:
以将它们与其他列区分开来,并在条形图中创建另一列。请考虑修改列的所有值,使其作为字符串。
xfyts7mz2#
通常更容易更新数据,然后用更新后的数据绘图。首先,获取uid的值(new和old)的和,然后删除噪声大于5的行。添加新的求和值并绘图。