如何在Matplotlib中创建“点图”?(非散点图)

szqfcxe2  于 2023-08-06  发布在  其他
关注(0)|答案(6)|浏览(114)

我想创建一个我的统计学书所称的“点图”,图中的点的数量等于观察的数量。下面是一个mathisfun.com的例子:


的数据
在该示例中,X轴上0值上方有六个点,表示值为零的六个观测值。
似乎“点图”可以有几种变化。在查找如何使用Matplotlib创建这个图时,我只遇到了我所知道的散点图,其中有一个数据点表示X和Y值之间的关系。
我试图创建的绘图类型是否可以使用Matplotlib?

qjp7pelc

qjp7pelc1#

假设你有一些数据可以生成如下的直方图,

import numpy as np; np.random.seed(13)
import matplotlib.pyplot as plt

data = np.random.randint(0,12,size=72)

plt.hist(data, bins=np.arange(13)-0.5, ec="k")

plt.show()

字符串


的数据
您可以通过计算直方图并绘制所有可能点的散点图来创建点图,如果点的颜色超过直方图给出的数量,则点的颜色为白色。

import numpy as np; np.random.seed(13)
import matplotlib.pyplot as plt

data = np.random.randint(0,12,size=72)
bins = np.arange(13)-0.5

hist, edges = np.histogram(data, bins=bins)

y = np.arange(1,hist.max()+1)
x = np.arange(12)
X,Y = np.meshgrid(x,y)

plt.scatter(X,Y, c=Y<=hist, cmap="Greys")

plt.show()


或者,您可以将不需要的点设置为nan

Y = Y.astype(np.float)
Y[Y>hist] = np.nan

plt.scatter(X,Y)


ws51t4hk

ws51t4hk2#

这个答案是建立在eyllanesc在他对这个问题的评论中发布的代码上的,因为我发现它足够优雅,值得一个说明性的例子。我提供两个版本:一个是简单的版本,其中手动设置格式化参数,另一个是第二版本,其中根据数据自动设置一些格式化参数。

简单版,手动格式化

import numpy as np                 # v 1.19.2
import matplotlib.pyplot as plt    # v 3.3.2

# Create random data
rng = np.random.default_rng(123) # random number generator
data = rng.integers(0, 13, size=40)
values, counts = np.unique(data, return_counts=True)

# Draw dot plot with appropriate figure size, marker size and y-axis limits
fig, ax = plt.subplots(figsize=(6, 2.25))
for value, count in zip(values, counts):
    ax.plot([value]*count, list(range(count)), 'co', ms=10, linestyle='')
for spine in ['top', 'right', 'left']:
    ax.spines[spine].set_visible(False)
ax.yaxis.set_visible(False)
ax.set_ylim(-1, max(counts))
ax.set_xticks(range(min(values), max(values)+1))
ax.tick_params(axis='x', length=0, pad=8, labelsize=12)

plt.show()

字符串


的数据

自动格式化高级版

如果您计划经常使用此图,则添加一些自动格式设置参数以获得适当的图形尺寸和标记大小可能很有用。在下面的示例中,参数的定义方式最适合于这种类型的图通常有用的数据类型(整数数据,范围最多为几十个单位,不超过几百个数据点)。

# Create random data
rng = np.random.default_rng(1) # random number generator
data = rng.integers(0, 21, size=100)
values, counts = np.unique(data, return_counts=True)

# Set formatting parameters based on data
data_range = max(values)-min(values)
width = data_range/2 if data_range<30 else 15
height = max(counts)/3 if data_range<50 else max(counts)/4
marker_size = 10 if data_range<50 else np.ceil(30/(data_range//10))

# Create dot plot with appropriate format
fig, ax = plt.subplots(figsize=(width, height))
for value, count in zip(values, counts):
    ax.plot([value]*count, list(range(count)), marker='o', color='tab:blue',
            ms=marker_size, linestyle='')
for spine in ['top', 'right', 'left']:
    ax.spines[spine].set_visible(False)
ax.yaxis.set_visible(False)
ax.set_ylim(-1, max(counts))
ax.set_xticks(range(min(values), max(values)+1))
ax.tick_params(axis='x', length=0, pad=10)

plt.show()


nwo49xxi

nwo49xxi3#

将数据集传递给此函数:

def dot_diagram(dataset):
    values, counts = np.unique(dataset, return_counts=True)
    data_range = max(values)-min(values)
    width = data_range/2 if data_range<30 else 15
    height = max(counts)/3 if data_range<50 else max(counts)/4
    marker_size = 10 if data_range<50 else np.ceil(30/(data_range//10))
    fig, ax = plt.subplots(figsize=(width, height))
    for value, count in zip(values, counts):
        ax.plot([value]*count, list(range(count)), marker='o', color='tab:blue',
                ms=marker_size, linestyle='')
    for spine in ['top', 'right', 'left']:
        ax.spines[spine].set_visible(False)
    ax.yaxis.set_visible(False)
    ax.set_ylim(-1, max(counts))
    ax.set_xticks(range(min(values), max(values)+1))
    ax.tick_params(axis='x', length=0, pad=10)

字符串

tquggr8v

tquggr8v4#

假设这是我的数据:

data  = [5,8,3,7,1,5,3,2,3,3,8,5]

字符串
为了绘制一个“点图”,我将需要的数据(x轴)和频率(y轴)

pos = [] 
keys = {} # this dict will help to keep track ...

# this loop will give us a list of frequencies to each number
for num in data: 
   if num not in keys:
      keys[num] = 1
      pos.append(1)
   else:
      keys[num] += 1
      apos.append(keys[num])

print(pos)
[1, 1, 1, 1, 1, 2, 2, 1, 3, 4, 2, 3]

plt.scatter(data, pos)
plt.show()


的数据

q43xntqr

q43xntqr5#

最近我也想到了这样的事情。我为我的案子做了以下陈述。
希望这对你有帮助。
我们首先生成频率表,然后从中生成点来做散点图。就这样!超级简单。
例如,在您的情况下,我们有0分钟,6人。这个频率可以转换成

[(0,1),(0,2),(0,3),(0,4),(0,5),(0,6)]

字符串
然后,必须使用pyplot.scatter简单地绘制这些点。

import numpy as np
import matplotlib.pyplot as plt

def generate_points_for_dotplot(arr):
    freq = np.unique(arr,return_counts=True)
    ls = []
    for (value, count) in zip(freq[0],freq[1]):
        ls += [(value,num) for num in range(count)]
    x = [x for (x,y) in ls]
    y = [y for (x,y) in ls]
    return np.array([x,y])


当然,这个函数返回一个包含两个数组的数组,一个用于x坐标,另一个用于y坐标(只是因为,这就是pyplot需要点的原因!)。现在,我们有了生成所需点的函数,让我们绘制它。

arr = np.random.randint(1,21,size=100)
x,y = generate_points_for_dotplot(arr)

# Plotting
fig,ax = plt.subplots(figsize = (max(x)/3,3)) # feel free to use Patricks answer to make it more dynamic
ax.scatter(x,y,s=100,facecolors='none',edgecolors='black')
ax.set_xticks(np.unique(x))
ax.yaxis.set_visible(False)
# removing the spines
for spine in ['top', 'right', 'left']:
    ax.spines[spine].set_visible(False)
plt.show()

输出:

x1c 0d1x的数据
也许,如果x刻度变得太大,你可以旋转它们。然而,对于更多数量的值,这也变得笨拙。

bpzcxfmw

bpzcxfmw6#

做简单的方式

使用ArviZ

如果你可以使用额外的软件包,我建议使用ArviZ,它使用Matplotlib并提供适当的点图。
Documentation of ArviZ dotplot

示例代码

import matplotlib.pyplot as plt
import numpy as np
import arviz as az

# Data is hardcoded here while a more sophisticated method can be used
data = np.array([0, 0, 0, 0, 0, 0, 1, 1, 2, 2, 2, 4, 4, 5, 5, 5, 5, 5, 8, 8, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 11, 11, 11, 11, 12])

# The main plotting function call
ax = az.plot_dot(data, dotcolor="C1", dotsize=0.8)

# Setting title
ax.set_title("Minutes to Eat Breakfast")

plt.show()

字符串

输出


的数据

相关问题