我有一个名为df的Dataframe
Dataframe测向
我有下面的代码
def func(row):
temp=row.asDict()
temp["concat_val"]="|".join([str(x) for x in row])
put=Row(**temp)
return put
DF.show()
row_rdd=DF.rdd.map(func)
concat_df=row_rdd.toDF().show()
我得到了这样的结果
但是,我需要一个输出,它将从concat\val列中删除id和nm列值。这张table应该如下所示
请建议删除id和nm值的方法
1条答案
按热度按时间cgh8pdjw1#
所以你要在这里集中注意力
txt
以及uppertx
值应以“|”分隔。你可以试试下面的代码。输出
您可以在spark文档中找到有关concat和concat的更多信息。
我希望这有帮助。