如何从xml文件创建配置单元表,只有很少的特定字段??例如,我有一个包含1000个字段的xml文件,但我的配置单元表中只需要100个字段。除此之外。如何将100个字段存储在不同的数据库和表中?
1sbrub3j1#
通常的方法是对xml文件运行xlst转换,生成1到n个csv文件,这些文件可以存储在hdfs上,然后通过配置单元外部表公开数据,或者在第二阶段加载到orc/parquet表。
1条答案
按热度按时间1sbrub3j1#
通常的方法是对xml文件运行xlst转换,生成1到n个csv文件,这些文件可以存储在hdfs上,然后通过配置单元外部表公开数据,或者在第二阶段加载到orc/parquet表。