我有以下spark dataframe,我想将一列中的所有列聚合为json,如下所示:如果输入dataframe为:
key,name,title
123,hsd,jds
148,sdf,qsz
589,qsz,aze
预期结果将是:
key,name,title,aggregation
123,hsd,jds,{"key":"123","name":"hsd", "title":"jds"}
148,sdf,qsz,{"key":"148","name":"sdf", "title":"qsz"}
589,qsz,aze,{"key":"589","name":"qsz", "title":"aze"}
解决方案不应硬编码字段名称,有什么想法如何做到这一点,请?
2条答案
按热度按时间oxosxuxt1#
使用
to_json
但使用更灵活的列:ygya80vv2#
你可以用
to_json
功能如果您有许多列,可以在下面使用它。
输出: