这是我dataset
DataFrame[column1: double, column2: double, column3: int, column4: int, column5: int, ... , column300: int]
我想要的是
DataFrame[column1: double, column2: double, column3: double, column4: double, column5: double, ... , column300: double]
我所做的
太手动了,你能告诉我怎么做吗?
3条答案
按热度按时间q7solyqu1#
可以使用列表解析来构造转换后的字段列表。
i86rm4rw2#
首先需要从可用模式中过滤出
int
列类型。然后结合reduce,您可以迭代
DataFrame
以将它们强制转换为您的选择reduce
是一个非常重要和有用功能,通常可以用来导航Spark中的任何迭代用例数据准备
标识
减少
fd3cxomn3#
VectorAssembler将整数值转换为多个列中的浮点值。您可以将向量列分成多个列,并按如下所示重命名列。