我用
sns.distplot
来绘制观察值的单变量分布。不过,我不仅需要图表,还需要数据点。如何从matplotlib Axes(由distplot返回)中获取数据点?
h4cxqtbf1#
您可以使用matplotlib.patches API。例如,要获取第一行:
sns.distplot(x).get_lines()[0].get_data()
这将返回两个numpy数组,其中包含直线的x和y值。对于条形图,信息存储在:
sns.distplot(x).patches
您可以通过函数patches.get_height()访问条的高度:
patches.get_height()
[h.get_height() for h in sns.distplot(x).patches]
eiee3dmh2#
如果你想获得直方图的kde值,你可以使用scikit-learnKernelDensity函数:
KernelDensity
import numpy as np import pandas as pd from sklearn.neighbors import KernelDensity ds=pd.read_csv('data-to-plot.csv') X=ds.loc[:,'Money-Spent'].values[:, np.newaxis] kde = KernelDensity(kernel='gaussian', bandwidth=0.75).fit(X) #you can supply a bandwidth #parameter. x=np.linspace(0,5,100)[:, np.newaxis] log_density_values=kde.score_samples(x) density=np.exp(log_density_values) array([1.88878660e-05, 2.04872903e-05, 2.21864649e-05, 2.39885206e-05, 2.58965064e-05, 2.79134003e-05, 3.00421245e-05, 3.22855645e-05, 3.46465903e-05, 3.71280791e-05, 3.97329392e-05, 4.24641320e-05, 4.53246933e-05, 4.83177514e-05, 5.14465430e-05, 5.47144252e-05, 5.81248850e-05, 6.16815472e-05, 6.53881807e-05, 6.92487062e-05, 7.32672057e-05, 7.74479375e-05, 8.17953578e-05, 8.63141507e-05, .......................... .......................... 3.93779919e-03, 4.15788216e-03, 4.38513011e-03, 4.61925890e-03, 4.85992626e-03, 5.10672757e-03, 5.35919187e-03, 5.61677855e-03])
wgx48brx3#
这将得到你想要的kde曲线
line = sns.distplot(data).get_lines()[0] plt.plot(line.get_xdata(), line.get_ydata())
nfs0ujit4#
在seaborn的更新版本中,情况不再是这样。首先,distplot被替换为displot。其次,当调用get_lines()时,出现一条错误消息AttributeError:“FacetGrid”对象没有属性“get_lines”。
4条答案
按热度按时间h4cxqtbf1#
您可以使用matplotlib.patches API。例如,要获取第一行:
这将返回两个numpy数组,其中包含直线的x和y值。
对于条形图,信息存储在:
您可以通过函数
patches.get_height()
访问条的高度:eiee3dmh2#
如果你想获得直方图的kde值,你可以使用scikit-learn
KernelDensity
函数:wgx48brx3#
这将得到你想要的kde曲线
nfs0ujit4#
在seaborn的更新版本中,情况不再是这样。首先,distplot被替换为displot。其次,当调用get_lines()时,出现一条错误消息AttributeError:“FacetGrid”对象没有属性“get_lines”。