如何在AmazonAthena中查询json？

b5lpy0ml 于 2021-07-26 发布在 Java

关注(0)|答案(2)|浏览(487)

我有一个类似于以下内容的json数组结构：

[elem1
 elem2 
 attr
  -- code1
  -- code2
]

我能够上传这些json并正确保存它们的格式，并使用aws glue对json进行爬网，我得到了所有正确的数据结构元素（attr有许多正确提取的子元素）。
当我去雅典娜的时候；但是，我做了一个 select * ，我得到了3个基本列（elem1、elem2、attr），但行中的每个json都是一个整体：

elem1                                            |elem2                                                
---------------------------------------------------------------------------------------------------
{elem1:"a",elem2:"b",attr:{code1:"1",code2:"2"}} |{elem1:"a",elem2:"b",attr:{code1:"1",code2:"2"}}

（末尾有attr作为列名）
有趣的是，当我将数据关联到一个Parquet文件中时，所有字段都被保留了下来，但我担心会有某种数据丢失，因为一行中存储了多个json，所以可能会有某种覆盖问题。
关于如何进行有什么想法吗？我一直在尝试在athena上查询json，但这可能只是json本身的问题（我下载了json并查看了它的结构，它看起来很好）。

sql JSON aws-glue amazon-athena

来源：https://stackoverflow.com/questions/62163086/how-to-query-a-json-in-amazon-athena