我有hdfs格式的原始文件姓名=年龄=10位置=qwerty名称=定义年龄=15位置=iIORS如何将这些平面文件中的数据导入到仅包含“name”和“location”列的配置单元表中。
wxclj1h51#
您可以执行以下操作。在表声明中,使用:
ROW FORMAT DELIMITED FIELDS TERMINATED BY ' ' --space MAP KEYS TERMINATED BY '='
此外,您的表将有一个数据类型为map的列。因此,当您可以使用键从单个列中注销数据时。其他选择:写你自己的serde。下面的链接解释了json数据的处理过程。我相信您可以根据您的要求定制:http://blog.cloudera.com/blog/2012/12/how-to-use-a-serde-in-apache-hive/
1条答案
按热度按时间wxclj1h51#
您可以执行以下操作。
在表声明中,使用:
此外,您的表将有一个数据类型为map的列。
因此,当您可以使用键从单个列中注销数据时。
其他选择:写你自己的serde。下面的链接解释了json数据的处理过程。我相信您可以根据您的要求定制:http://blog.cloudera.com/blog/2012/12/how-to-use-a-serde-in-apache-hive/