{simpleDF.columns
#output :['color', 'lab', 'value1', 'value2']
indexer = simpleDF.select('lab')
from pyspark.ml.feature import StringIndexer
# Let us create an object of the class StringIndexer
lblindexer=StringIndexer().setInputCol(indexer).setOutputCol("LabelIndexed")
idxRes=lblindexer.fit(simpleDF).transform(simpleDF)
idxRes.show(5)}
这是工作与这行代码,但我希望它更一般
# lblindexer=StringIndexer().setInputCol('lab').setOutputCol("LabelIndexed")
获取错误:typeerror:为param“inputcol”给定的param值无效。无法将<class'pyspark.sql.dataframe.dataframe'>转换为字符串类型
1条答案
按热度按时间dl5txlt91#
为输入列使用列名,而不是Dataframe:
如果你想使用一个变量,