如何将JSON数据集中包含一组元素的数组(在一列中)转换为包含python、spark或panda的多列?数据的结构如下:
root
|-- items: array (nullable = true)
| |-- element: struct (containsNull = true)
| | |-- id: string (nullable = true)
| | |-- idAccount: long (nullable = true)
| | |-- infractionType: string (nullable = true)
| | |-- responseTime: string (nullable = true)
| | |-- status: string (nullable = true)
| | |-- transactionCode: string (nullable = true)
我期待着这样的结果:
| 标识符|id帐户|
| - -|- -|
| 价值|价值|
| 价值|价值|
1条答案
按热度按时间g6ll5ycj1#
在Spark SQL中,可以使用
getItem
访问ArrayType
或MapType
列中的项。