我有一个像这样的框架
| Column |
|------------------------------------------------|
|[{a: 2, b: 4}, {a: 2, b: 3}] |
|------------------------------------------------|
|[{a: 12, b: 14}, {a: 25, b: 33}, {a: 22, b: 31}]|
...
字符串
我需要把它转换成一个类似于
| a | b |
|---|---|
| 2 | 4 |
| 2 | 3 |
|12 |13 |
型
1条答案
按热度按时间bq3bfh9z1#
最简单的方法可能是使用SparkSQL函数
inline
,如下所示:字符串
请注意,虽然
inline
自2.0
以来一直是SparkSQL API的一部分,但它仅在Spark 3.4+
上作为DataFrame的内置函数可用。要在旧版Spark上使用它,请像下面这样用expr
Package 它:型