如何使用R中的tidymodels或caret进行有序回归/分类?

ni65a41a  于 2023-01-03  发布在  其他
关注(0)|答案(1)|浏览(147)

我知道R软件包'' tidymodels and caret ''都支持多项式分类,但是有哪一个软件包支持有序回归/分类吗?下面是我所说的"有序回归/分类":

  • 常规回归:估计数,例如范围从1到250的数值
  • 二元分类:估计二进制值,例如0或1;阳性或阴性;是或否
  • 多项分类:估计两个以上类别中的一个,例如岩石|纸|剪刀;红色|White|最重要的是,这些类别之间没有自然的顺序。
      • 有序回归/分类:估计排序类别,例如,第一|第二次|第3名;金牌|Silver|青铜|无奖牌|低|培养基|高|最重要的是,这些类别之间存在着一种自然的顺序。

有序范畴要么被当作分类任务,要么被当作回归任务,这两种都是不合适的。它们经常被当作回归问题,通过将范畴转换成数字来处理(R中的数字类型),但这并不总是合适的,尤其是在类别之间不存在一致有意义的间隔距离或者类别之间的小数在现实世界中无意义的情况下。如果金|Silver|青铜|无奖牌则折算为3| 2| 1| 0,那么估计得分2.5意味着什么?金与银的距离是否与铜与无奖牌的距离相同?)有序类别也常常被当作分类问题,将其转化为R中的无序因子,然后简单地进行多项式分类,但这也是不令人满意的,因为这样的处理完全忽略了类别之间的顺序,因此丢失了真实世界信息的重要部分,该真实世界信息应当有助于改进分类的性能。
因此,估计此类结果的适当技术是将其编码为R中的有序因子,然后应用**ordinal regression(也称为有序分类)**,适用于有序分类结果的一种逻辑回归。R使用MASS::polrrms::orm包实现有序回归,这是一种分类技术,它保留并使用结果变量的顺序信息,以提高估计的性能,超过常规回归或多项式分类所能做到的。
然而,这些软件包通常用于统计分析,而不是机器学习。R中的机器学习框架,如tidymodelscaret似乎没有它们的接口。那么,在'' tidymodels and caret ''或R中的其他机器学习框架中,是否有任何对有序回归/分类的内置支持?

bxpogfeg

bxpogfeg1#

这本书有一整节是关于插入符号中的序数结果的,看看那里。

相关问题