我在pyspark中使用多名义logistic回归。
我有3个班,分别是0,1和2
我已经参考了下面的链接进行解释。然而,从我的输出我有几个问题。请检查
多项式logistic回归中系数矩阵、截距向量和混淆矩阵的解释
下面是我的响应变量编码为
|label|nps_category|
|1.0 |Low |
|2.0 |Medium |
|0.0 |High |
下面是转换为Dataframe的稠密矩阵。下面a、b、c是特征,值是其矩阵系数
|a|b|c
|-0.1437293719469877 |0.14376690138897105 |-0.3365062932684657
|0.24949364699076101 |-0.12324292572541203 |0.41774827297026096
|-0.10257959384745327 |-0.005988852052928155 |-0.07248360537016586
|-0.0031846811963206377|-0.014535123610635567 |-0.008758374331629884
多项式logistic回归中系数矩阵、截距向量和混淆矩阵的解释
以下是我的问题与上述输出
1) 我想了解为什么有4行如果我的理解是正确的,从上面的链接它是告诉每一行对应一个模型。我想知道需要设置pyspark的参数
2) 我怎么知道矩阵系数值对应于0,1或2类。
请不要忽视帮助我在这个理解。如果还有其他问题,我也会回答
请帮助我理解
暂无答案!
目前还没有任何答案,快来回答吧!