嗨,我正在绘制三个不同的直方图,它们具有不同的总频率,但我想将它们归一化,以便频率相同。
从图中可以看出,这三组具有不同的总频率,但我想将它们归一化,以便它们具有相同的总频率,但我想保留x轴每个值的频率比例。
下面是我用来绘制直方图的代码
setA = [22.972972972972972, 0.0, 0.0, 27.5, 25.0, 18.64406779661017, 8.88888888888889, 20.512820512820515, 11.11111111111111, 15.151515151515152, 17.741935483870968, 13.333333333333334, 16.923076923076923, 12.820512820512821, 27.77777777777778, 4.0, 0.0, 15.625, 14.814814814814815, 7.142857142857143, 15.384615384615385, 14.545454545454545, 38.095238095238095, 17.647058823529413, 21.951219512195124, 21.428571428571427, 32.432432432432435, 10.526315789473685, 36.8421052631579, 13.114754098360656, 17.91044776119403, 12.64367816091954, 16.0, 22.727272727272727, 18.181818181818183, 9.523809523809524, 17.105263157894736, 11.904761904761905, 20.58823529411765, 10.714285714285714, 15.686274509803921, 27.5, 16.129032258064516, 21.333333333333332, 40.90909090909091, 11.904761904761905, 13.157894736842104]
setB = [1.492537313432836, 3.5714285714285716, 17.94871794871795, 11.363636363636363, 13.513513513513514, 14.285714285714286, 15.686274509803921, 17.94871794871795, 9.090909090909092, 41.07142857142857, 10.714285714285714, 25.0, 20.0, 40.0, 13.333333333333334, 13.793103448275861, 3.5714285714285716, 17.073170731707318, 25.675675675675677, 15.625, 17.46031746031746, 8.333333333333334, 18.64406779661017, 14.285714285714286, 0.0, 6.0606060606060606, 6.976744186046512, 18.181818181818183, 26.785714285714285, 22.80701754385965, 6.666666666666667, 12.5]
setC = [13.846153846153847, 23.076923076923077, 25.0, 10.714285714285714, 16.666666666666668, 9.75609756097561, 10.0, 10.0, 17.857142857142858, 20.0, 9.75609756097561, 26.470588235294116, 12.5, 13.333333333333334, 4.3478260869565215, 5.882352941176471, 14.545454545454545, 13.333333333333334, 8.571428571428571, 11.764705882352942, 0.0]
plt.figure('sets')
n, bins, patches = plt.hist(setA, 20, alpha=0.40 , label = 'setA')
n, bins, patches = plt.hist(setB, 20, alpha=0.40 , label = 'setB')
n, bins, patches = plt.hist(setC, 20, alpha=0.40 , label = 'setC')
plt.xlabel('Set')
plt.ylabel('Frequency')
plt.title('Different Sets that need to be normalised')
plt.legend()
plt.grid(True)
plt.show()
作为一个加号,因为我的目标是能够比较三组的分布,有没有一个更好的可视化的直方图,我可以用来比较他们更好的图形。
3条答案
按热度按时间mfpqipee1#
您可以使用
normed=True
选项对直方图进行归一化。这意味着所有直方图的面积总和为1。您还可以通过对所有三个直方图使用相同的固定箱(使用
bins
选项到hist
:bins = np.arange(0,48,2)
)。试试这个:
另一种选择是在一次调用plt.hist中绘制所有三个直方图,在这种情况下,您可以使用
stacked=True
选项,它可以进一步清理您的图。注意:此方法将三个直方图都归一化,因此总积分为1。它不会使三个直方图相加为相同的值。
或者,最后,如果堆叠直方图不符合您的口味,您可以绘制彼此相邻的条形图,再次在一次调用中绘制所有三个直方图,但从上面的行中删除
stacked=True
选项:如注解中所讨论的,当使用
stacked=True
时,normed
选项仅意味着所有三个直方图的总和将等于1,因此它们可能不会以与其他方法相同的方式进行归一化。为了解决这个问题,我们可以使用
np.histogram
,并使用plt.bar
绘制结果。例如,使用上述相同的数据集:
nmpmafwu2#
我个人很喜欢这个功能:
样地:
py49o6xq3#
seaborn.histplot
或seaborn.displot
和kind='hist'
来实现。seaborn
是matplotlib
的高级APIcommon_norm
:如果True
并且使用归一化统计,则归一化将应用于整个数据集。否则,独立地归一化每个直方图。multiple
:{'layer', 'dodge', 'stack', 'fill'}
-如何显示多组数据。stat
:在每个bin中计算的聚合统计量,相关轴将标记与所选stat
对应的标签'probability'
:标准化,使条高总和为1'density'
:归一化,使得直方图的总面积等于1'count'
、'frequency'
和'percent'
*在
python 3.11.2
、pandas 2.0.0
、matplotlib 3.7.1
、seaborn 0.12.2
中测试导入和样本数据
Plots