我在scala中有以下sparkDataframe:
+---------+--------------------+--------------------+--------------------+
| id| col_str_1| col_str_2| col_list|
+---------+--------------------+--------------------+--------------------+
| 1| A| C| [E, F]|
| 2| B| D| [G, H]|
+---------+--------------------+--------------------+--------------------+
其中,列1和列2的类型为stirng,列列表的类型为list[string]。
我需要一种将此Dataframe转换为以下内容的方法:
+---------+--------------------+
| id| col_list|
+---------+--------------------+
| 1| [E, F, A, C]|
| 2| [G, H, B, D]|
+---------+--------------------+
你知道吗?谢谢您。
1条答案
按热度按时间6l7fqoea1#
你可以用
concat
要将元素附加到数组列,请执行以下操作: