我在求曲线的切向量。曲线的方程是一个问题,我有不同的点,基于这些点,我正在寻找函数的近似值,它描述曲线并拟合点。
当我绘制我的数据时,它看起来像这样:
应用多项式回归后(基于本文:https://www.statology.org/curve-fitting-in-r/)得到以下结果:
fit <- lm(cl2[,3] ~ poly(cl2[,2], 3))
summary(fit)
Call:
lm(formula = cl2[, 3] ~ poly(cl2[, 2], 3))
Residuals:
Min 1Q Median 3Q Max
-0.31834 -0.10187 0.02132 0.09577 0.27393
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -109.89121 0.03789 -2900.217 < 2e-16 ***
poly(cl2[, 2], 3)1 7.33365 0.16516 44.403 < 2e-16 ***
poly(cl2[, 2], 3)2 -4.43572 0.16516 -26.857 4.25e-14 ***
poly(cl2[, 2], 3)3 1.14772 0.16516 6.949 4.66e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.1652 on 15 degrees of freedom
Multiple R-squared: 0.9946, Adjusted R-squared: 0.9935
F-statistic: 913.7 on 3 and 15 DF, p-value: < 2.2e-16
当我拟合曲线时,结果看起来不错:
lines(cl2[,2], predict(fit, data.frame(cl2[,2:3])))
基于系数s,我假设曲线的方程为:
1.14x**3-4.43x**2+7.33*x-109
当我计算y的估计值时,我得到了非常奇怪的数字:
y_actual:
1 -108.4569 -108.1504 -108.0895 -108.0728 -108.0461 -108.1777 -108.2751 -108.4619 -108.6918 [10] -108.9750 -109.3552 -109.7625 -110.3328 -110.9580 -111.4312 -112.0062 -112.7337 -113.5880 [19] -114.3681
y_predicted:
1 -8935267 -8980331 -9044297 -9115821 -9166614 -9270340 -9355643 -9456574 -9533497 -9602089 [11] -9631113 -9670175 -9715100 -9754453 -9798813 - 9851816 -9880888 -9926067 -9940310
这是怎么回事?
我试着将poly函数的原始变量设置为TRUE,得到了不同的系数,但问题仍然存在。
编辑
dput
的数据
y_actual <-
c(-108.4569, -108.1504, -108.0895, -108.0728, -108.0461, -108.1777,
-108.2751, -108.4619, -108.6918, -108.975, -109.3552, -109.7625,
-110.3328, -110.958, -111.4312, -112.0062, -112.7337, -113.588,
-114.3681)
y_predicted <-
c(-8935267, -8980331, -9044297, -9115821, -9166614, -9270340,
-9355643, -9456574, -9533497, -9602089, -9631113, -9670175, -9715100,
-9754453, -9798813, -9851816, -9880888, -9926067, -9940310)
编辑:
x_values <- c(-197.3419, -197.6753, -198.1467, -198.6710, -199.0418, -199.7946, -200.4095, -201.1323, -201.6797, -202.1654, -202.3702, -202.6451, -202.9605, -203.2359, -203.5455, -203.9142, -204.1158, -204.4285, -204.5268)
问题解决方案:
感谢大家的宝贵意见。帮了大忙。
我提出了以下函数:
#find tangent line
tangent_xy <- function(point_index, centerline){
#fit the polynomial regression
fit <- lm(centerline[,3] ~ poly(centerline[,2], 3, raw = T))
# get coefficients
cf <- fit$coefficients
# equation of fitted curve
(eq <- paste(sprintf('%s*x^%s', cf, seq_along(cf) - 1L), collapse='+'))
# first derivative of fitted curve
f <- D(parse(text = eq), "x")
# calculate slope (value of derivative at given point)
slope <- eval(f, envir = list(x = cl2[point_index,2]))
#get coordinates of point
x0 <- centerline[point_index, 2]
y0 <- centerline[point_index, 3]
# equation of tangent line
y = slope*centerline[,2]-slope*x0+y0
# points for plotting with lines function
return(y)
}
使用如下函数:
curve(ff, min(cl2[,2]), max(cl2[,2]))
lines(cl2[,2], tangent_xy(3, cl2))
lines(cl2[,2], tangent_xy(12, cl2))
lines(cl2[,2], tangent_xy(15, cl2))
lines(cl2[,2], tangent_xy(7, cl2))
我得到以下输出:
它并不完美,但我只需要近似值,所以它就可以了。我将按照罗兰的建议调查GAM。也许这些会更好地工作。
3条答案
按热度按时间zrfyljdw1#
要从
coef
因子生成方程,请使用sprintf
表示幂级数。parse
d转换成函数,我们可以用curve
在points
上绘制它。zbdgwd5y2#
下面是代码中的示例。由于没有提供,我对x值进行了近似。我上面的评论是:“使用
raw=TRUE
作为非正交多项式”。蓝线是预测函数的预测值。而红线使用拟合的系数。请注意,绿色线使用相同的系数,但四舍五入到5位有效数字,并产生略有不同的曲线。
这是高阶方程的问题,一个微小的差异被乘以变成一个很大的差异。一个混乱的系统。
uwopmtnx3#
如果你没有一个基于科学的模型,并且需要凭经验来做,我建议你使用GAM。