我试图在F中添加一个if条件。当在pyspark列中时,我的代码:
df = df.withColumn("column_fruits",F.when(F.col('column_fruits') == "Berries"
if("fruit_color")== "red":
return "cherries"
elif("fruit_color") == "pink":
return "strawberries"
else:
return "balackberries").otherwise("column_fruits")
我想先过滤掉浆果,然后根据颜色改变水果的名字。剩下的水果都保持不变。谁能告诉我这是不是写withColumn
代码的有效方法?
1条答案
按热度按时间c9qzyr3d1#
这样就行了
样品输入/输出: