从csv文件上传到配置单元表的空值

csbfibhn  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(462)

我是hadoop hive的新手。我们正在使用开源hadoop配置单元。它安装在一个单节点集群上。我在一个csv文件中有一百万行数据,我把它从windows移到linux。当使用foolwing命令将数据上传到配置单元时,空值被上传到表中。

LOAD DATA INPATH '/home/goldstone/Desktop/RejectStats.csv' 
OVERWRITE INTO TABLE rejstats;

我甚至尝试通过tplace文件hdfs上传值,但仍然存在相同的问题。
我的表格结构如下:

CREATE TABLE rejstats( amount_requested INT , appdate TIMESTAMP , loan_title STRING , dbt_income_ratio FLOAT , city STRING , state STRING , employment_lenght STRING)
ROW FORMAT
DELIMITED FIELDS TERMINATED BY '\t'
STORED AS TEXTFILE;

我附上返回的空值的屏幕截图。
任何人都可以帮我解决这个问题。谢谢您。
你好,迪维亚。

kknvjkwl

kknvjkwl1#

我想您正在使用的表中输入一个逗号分隔的文件 FIELDS TERMINATED BY '\t' i、 电子标签。请尝试以下操作:

CREATE TABLE rejstats (amount_requested INT , appdate TIMESTAMP , 
loan_title STRING , dbt_income_ratio FLOAT , city STRING , 
state STRING , employment_lenght STRING) ROW FORMAT DELIMITED FIELDS 
TERMINATED BY ',' STORED AS TEXTFILE;

LOAD DATA INPATH '/home/goldstone/Desktop/RejectStats.csv' 
OVERWRITE INTO TABLE rejstats;

相关问题