我有一张Hive桌:
id name address cid
1 ABC {"city":"Tampa","state":"FL"} 1
2 XYZ {"city":"SF","state":"CA"} 1
希望根据cid分组并获得:
address cid
{"city":"Tampa","state":"FL"}{"city":"SF","state":"CA"} 1
我尝试了collect\u set和collect\u list,但它们都只适用于基本类型。
1条答案
按热度按时间2lpgd9681#
实现这一点的一个快速方法是选择struct字段作为单独的列,然后使用本文中描述的方法(它需要brickhouse第三方udf)