如何从一个.csv文件中创建一个配置单元表,该文件有一列,字段用分号表示;

rslzwgfq  于 2021-05-30  发布在  Hadoop
关注(0)|答案(1)|浏览(347)

我有一个.csv文件,格式是一个(第一个)列/单元格,其中有五个我希望在配置单元表中使用分号分隔的字段;像这样:

ISBN;"Title";"Author";"Year";"Publisher"
0002005018;"Clara Callan";"Richard Bruce Wright";"2001";"HarperFlamingo Canada"
0399135782;"The Kitchen God's Wife";"Amy Tan";"1991";"Putnam Pub Group"

etc. 
etc.
...

我是否可以使用配置单元查询来拆分数据;并将其存储在我创建的具有相同列名顺序的表中?
比如regexp\u提取物?或者我需要用serde?
我刚接触hadoop/hive/beeswax,正在使用cloudera快速启动vm5.2

mnemlml8

mnemlml81#

听起来你想这样做:

CREATE TABLE books (ISBN STRING, Title STRING, Author STRING, Year STRING, Publisher STRING)
  ROW FORMAT DELIMITED FIELDS TERMINATED BY "\;";
LOAD DATA INPATH '/path/to/your/datafile' INTO TABLE books;

相关问题