在配置单元中导入具有key=value对的平面文件

i5desfxk  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(313)

我有hdfs格式的原始文件
姓名=年龄=10位置=qwerty
名称=定义年龄=15位置=iIORS
如何将这些平面文件中的数据导入到仅包含“name”和“location”列的配置单元表中。

wxclj1h5

wxclj1h51#

您可以执行以下操作。
在表声明中,使用:

ROW FORMAT DELIMITED
        FIELDS TERMINATED BY ' ' --space
        MAP KEYS TERMINATED BY '='

此外,您的表将有一个数据类型为map的列。
因此,当您可以使用键从单个列中注销数据时。
其他选择:写你自己的serde。下面的链接解释了json数据的处理过程。我相信您可以根据您的要求定制:http://blog.cloudera.com/blog/2012/12/how-to-use-a-serde-in-apache-hive/

相关问题