使用scipy
时,我注意到mannwhitneyu
函数使用nan
值来执行统计分析。
此外,此函数没有内置选项来省略这些值(R
中的等效函数省略Na值)。
允许这样的行为有什么意义。
范例:
import scipy as sp
sp.stats.mannwhitneyu(x = [nan, nan, nan, nan],
y = [nan, nan, nan, 2],
alternative='two-sided')
字符串
该操作产生:
MannwhitneyuResult(statistic=4.0, pvalue=0.312321421676216)
型
要正确使用该函数,应该使用.dropna()
。
我是不是缺少了什么东西来维持这种行为?
谢谢
1条答案
按热度按时间toiithl61#
自SciPy 1.8.0以来,
mannwhitneyu
一直支持nan_policy
。默认行为是nan_policy='propagate'
:字符串
还支持
'omit'
和'raise'
。“型