我是hadoop hive的新手。我们正在使用开源hadoop配置单元。它安装在一个单节点集群上。我在一个csv文件中有一百万行数据,我把它从windows移到linux。当使用foolwing命令将数据上传到配置单元时,空值被上传到表中。
LOAD DATA INPATH '/home/goldstone/Desktop/RejectStats.csv'
OVERWRITE INTO TABLE rejstats;
我甚至尝试通过tplace文件hdfs上传值,但仍然存在相同的问题。
我的表格结构如下:
CREATE TABLE rejstats( amount_requested INT , appdate TIMESTAMP , loan_title STRING , dbt_income_ratio FLOAT , city STRING , state STRING , employment_lenght STRING)
ROW FORMAT
DELIMITED FIELDS TERMINATED BY '\t'
STORED AS TEXTFILE;
我附上返回的空值的屏幕截图。
任何人都可以帮我解决这个问题。谢谢您。
你好,迪维亚。
1条答案
按热度按时间kknvjkwl1#
我想您正在使用的表中输入一个逗号分隔的文件
FIELDS TERMINATED BY '\t'
i、 电子标签。请尝试以下操作: