条件:
如果id的得分为“高”或“中”->则删除“无”
如果id只有score none->只保留none
输入:
IDSCOREAAAHIGHAAAMIDAANONEBBBNONE公司
期望输出:
idscoreaaahighaaamidbbbnone公司
我在pyspark中写if条件有困难。或者有没有其他方法来解决这个问题?
谢谢你的帮助。非常感谢!
条件:
如果id的得分为“高”或“中”->则删除“无”
如果id只有score none->只保留none
输入:
IDSCOREAAAHIGHAAAMIDAANONEBBBNONE公司
期望输出:
idscoreaaahighaaamidbbbnone公司
我在pyspark中写if条件有困难。或者有没有其他方法来解决这个问题?
谢谢你的帮助。非常感谢!
2条答案
按热度按时间izj3ouym1#
你可以数数
Score
Windows上方ID
,然后打开过滤器Score
不为null或计数为0:hgqdbh6s2#
您可以添加是否所有分数都为空的标志,并过滤分数不为空或标志为真(所有分数都为空)时的行: