hive:如何处理在数据文件中有分隔符的文件?

nmpmafwu  于 2021-05-29  发布在  Hadoop
关注(0)|答案(2)|浏览(445)

我有以下需要插入到配置单元表中的数据。数据在文件中具有默认分隔符。如何插入配置单元表?

10,Andrew,Man”,”ager,DE,PC
11,Arun,Manager,NJ,PC
12,Harish,Sales,NJ,MAC
13,Robert,Manager,PA,MAC
14,Laura,Engineer,PA,MAC

谢谢!

wmvff8tz

wmvff8tz1#

尝试使用csv serde

create table test_table(id int,...)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES (
   "separatorChar" = ",",
   "quoteChar"     = "”",
   "escapeChar"    = "\\"
)

根据数据更改quotechar

06odsfpq

06odsfpq2#

你有两个选择首先你可以使用 "|" (pipe)作为分隔符,然后插入到配置单元表中,否则必须将数据字段用双引号括起来 " " ,然后在为配置单元表创建ddl时使用opencsv serde。现在您可以查询表,而配置单元将正确显示数据。

相关问题