我使用R中的SIMPUTE包来输入连续变量。这是我的数据集
'data.frame': 6000 obs. of 11 variables:
$ age : chr "1" "1" "1" "1" ...
$ GI : num 5.29 12.52 2.03 NA 31.51 ...
$ sex : chr "2" "1" "1" "1" ...
$ Weight : num 1.2 1.2 1.2 1.2 1.2 ...
字符串
我使用以下命令从simpute包来填补“GI”变量使用年龄和性别来创建填补细胞。我有一个重量变量用于“概率”
imp_simpuatation<-impute_rhd(
data,
GI~age+sex,
pool = "univariate",
prob = Weight
)
型
但我得到以下错误:错误:对象'权重'未找到当我尝试prob= data$Weight
代替,我得到以下错误:
Error in impute_rhd(data, GI ~ age + sex, pool = "univariate", prob = data$Weight, :
length(prob) != nrow(dat) is not TRUE
而
> length(data$Weight)
[1] 6000
> nrow(data)
[1] 6000
1条答案
按热度按时间oaxa6hgo1#
我建议使用不同的插补包。
simputation
包有bug。正确的用法是
data$Weight
而不是Weight
。但错误是simputation
中的一个bug。作者has corrected the error you identified,但没有提交更新到CRAN。然而,代码仍然有bug。使用不同的软件包。安装开发版本,你会通过你的错误,但请注意,代码仍然是错误的:
字符串
[.data.frame
(dat,predictors)中的错误:选择了未定义的列