我已经创建了一个托管配置单元表,该表存储为orc,加载.txt文件时工作正常,但是无法将orc文件加载到该表中。与分隔符有关吗?还是我遗漏了什么?
wfsdck301#
经过几次尝试,以下是对我有效的解决方案:
create table MyDB.TEST ( Col1 String, Col2 String, Col3 String, Col4 String) STORED AS ORC LOCATION 'hdfs://hdfs/dir/folder/to/orc/files/';
xiozqbni2#
下面的代码为我工作,同时将hdfs中的orc文件加载到配置单元表中。在配置单元中创建表。
create table MyDB.TEST ( Col1 String, Col2 String, Col3 String, Col4 String) STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat';
将数据加载到表中。
LOAD DATA INPATH '/hdfs/dir/folder/to/orc/files/' INTO TABLE MyDB.TEST;
2条答案
按热度按时间wfsdck301#
经过几次尝试,以下是对我有效的解决方案:
xiozqbni2#
下面的代码为我工作,同时将hdfs中的orc文件加载到配置单元表中。
在配置单元中创建表。
将数据加载到表中。