我在Spark中有一个 Dataframe ,如下所示。
{"emp_id":1,"emp_name":"John","cust_id":"c1","cust_detail":[{"name":"abc","acc_no":123,"mobile":000},{"name":"abc","acc_no":123,"mobile":111},{"name":"abc","acc_no":123,"mobile":222}]}
我正在寻找如下的输出。
{"emp_id":1,"emp_name":"John","cust_id":"c1","cust_detail":[{"name":["abc"],"acc_no":[123],"mobile":[000,123,222]}
1条答案
按热度按时间nxagd54h1#
这就是您想要的东西:首先分解列,然后再聚合回来。
产出: