Pyspark Dataframe API
给定两个 Dataframe A和B,其中:
数据框A:
| id|姓名|
| - -----|- -----|
| ABC-2|约翰|
| 血脑屏障-1|彼得|
| def-y|金|
| xyz-0|布拉德|
数据框B:
| id_list|
| - -----|
| “abc-2”,“bbb-1”|
| “ABC-2”|
| “abc-2”,“xyz-0”|
最后的dataframe应该是:
数据框B:
| id_list|用户|
| - -----|- -----|
| “abc-2”,“bbb-1”|约翰,彼得|
| “ABC-2”|约翰|
| abc-2,xyz-0|布拉德?约翰|
我如何使用Pyspark dataframe API来实现这个结果?
1条答案
按热度按时间u3r8eeie1#
代码: