matplotlib 如何为箱线图离群值添加注解

tzcvj98z  于 2023-10-24  发布在  其他
关注(0)|答案(1)|浏览(148)

我有一个类似于下面的图(使用plt.boxplot()):

现在,我想要的是绘制出这些异常值出现的频率(最好是在每个异常值的右上角)。
这在某种程度上是可以实现的吗?

20jt8wwn

20jt8wwn1#

ax.boxplot返回箱线图中所有元素的字典。这里需要的关键字是'fliers'
boxdict['fliers']中,有Line2D示例用于绘制传单。我们可以使用.get_xdata().get_ydata()获取它们的xy位置。
您可以使用set查找所有唯一的y位置,然后使用.count()查找在该位置绘制的传单数量。
然后它只是一个使用matplotlib的ax.text向图添加文本标签的例子。
请考虑以下示例:

import matplotlib.pyplot as plt
import numpy as np

# Some fake data
data = np.zeros((10000, 2))
data[0:4, 0] = 1
data[4:6, 0] = 2
data[6:10, 0] = 3
data[0:9, 1] = 1
data[9:14, 1] = 2
data[14:20, 1] = 3

# create figure and axes
fig, ax = plt.subplots(1)

# plot boxplot, grab dict
boxdict = ax.boxplot(data)

# the fliers from the dictionary
fliers = boxdict['fliers']

# loop over boxes in x direction
for j in range(len(fliers)):

    # the y and x positions of the fliers
    yfliers = boxdict['fliers'][j].get_ydata()
    xfliers = boxdict['fliers'][j].get_xdata()

    # the unique locations of fliers in y 
    ufliers = set(yfliers)

    # loop over unique fliers
    for i, uf in enumerate(ufliers):

        # print number of fliers
        ax.text(xfliers[i] + 0.03, uf + 0.03, list(yfliers).count(uf))

plt.show()

相关问题