来源
- https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.var.html
- https://numpy.org/doc/stable/reference/generated/numpy.var.html
我理解自由度的选择与样本或总体方差(http://www.differencebetween.net/science/mathematics-statistics/difference-between-sample-variance-population-variance/)的方差计算建模决策有关。
我不明白的是,为什么Pandas选择了默认值,而继承numpy的默认值就不那么容易了。有人能解释一下为什么吗?
1条答案
按热度按时间djmepvbi1#
实际上我会问Numpy为什么选择
ddof=0
作为默认值,分母中的n-1
称为贝塞尔校正,通常用于1D样本方差,我实际上很惊讶Numpy的值是n
。这里有一个很好的讨论:https://stats.stackexchange.com/questions/406327/degrees-of-freedom-in-sample-variance