hadoop—如何避免配置单元表的第一个“字段名”中的“null”

cngwdvgl  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(422)

首先,我使用以下命令在hive中创建了表“emp”:

create table emp (id INT, name STRING, address STRING)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t';

然后通过下面的命令加载这个“emp”表中的数据:load data local inpath'\home\cloudera\desktop\emp.txt'overwrite into table emp;
当我从“emp”表中选择数据时:它显示表null的第一个字段,如下所示:

ca1c2owp

ca1c2owp1#

文件中有一个标题行和第一个值 id 无法转换为 INT 因此被替换为 NULL .
添加 tblproperties ("skip.header.line.count"="1") 添加到表定义
对于现有表- alter table emp set tblproperties ("skip.header.line.count"="1");

相关问题