我使用beta分布来模拟我的问题
我使用a和B参数优化曲线,得到了我想要的结果,但是当我试图计算两个点的概率时,使用较小的间隔来计算各自的面积,密度较小的点具有较高的概率,这没有任何意义。
a = 5
b = 16.2
def f(x):
return beta.pdf(x, a,b)
plt.scatter(0.22,f(0.22))
plt.scatter(0.24,f(0.24))
plt.plot(df["model's outcome"], df['vals'])
res, err = quad(f, 0.22,0.222222222222221)
res2, err = quad(f, 0.24,0.244444444444441)
print(res)
print(res2)
结果:
0.009754484452173983
0.018502765135697426
beta distribution
1条答案
按热度按时间wwtsj6pe1#
要从0.22得到0.222222222,你必须加上0.0022222222。
要从0.24得到0.244444444,你必须加上0.0044444444。
第二个区间的宽度是第一个区间的两倍,曲线下的额外区域可能就是来自这个。