将xml文件动态导入配置单元

ccgok5k5  于 2021-06-26  发布在  Hive
关注(0)|答案(1)|浏览(357)

如何从xml文件创建配置单元表,只有很少的特定字段??例如,我有一个包含1000个字段的xml文件,但我的配置单元表中只需要100个字段。除此之外。如何将100个字段存储在不同的数据库和表中?

1sbrub3j

1sbrub3j1#

通常的方法是对xml文件运行xlst转换,生成1到n个csv文件,这些文件可以存储在hdfs上,然后通过配置单元外部表公开数据,或者在第二阶段加载到orc/parquet表。

相关问题