我有一个pyspark数据框,有4列。前三个ara向量和最后一个是字符串。对于每一行,每个向量的长度是不同的。我想把前三个合并到一个名为features的列中,它将是一个长度为3的向量,每个元素将是我描述的向量。我尝试使用向量汇编,但结果只有一个向量。结果logistic回归显示了一个错误,因为正如我所说的,每一行的向量有不同的大小。提前谢谢。例子:
Col1 = [1.5,2.3,4.8]
Col2 = [1.2,3.6.1.9,10.5,3.2]
Col3 = [1.4,5.6]
Then feature for first row will be
Feature = [[1.5,2.3,4.8],[1.2,3.6.1.9,10.5,3.2], [1.4,5.6]]
暂无答案!
目前还没有任何答案,快来回答吧!