如何将外部创建的orc文件加载到存储为orc的配置单元表中?

k2arahey  于 2021-05-29  发布在  Hadoop
关注(0)|答案(2)|浏览(516)

我已经创建了一个托管配置单元表,该表存储为orc,加载.txt文件时工作正常,但是无法将orc文件加载到该表中。与分隔符有关吗?还是我遗漏了什么?

wfsdck30

wfsdck301#

经过几次尝试,以下是对我有效的解决方案:

create table MyDB.TEST (
Col1 String,
Col2 String,
Col3 String,
Col4 String)
STORED AS ORC
LOCATION 'hdfs://hdfs/dir/folder/to/orc/files/';
xiozqbni

xiozqbni2#

下面的代码为我工作,同时将hdfs中的orc文件加载到配置单元表中。
在配置单元中创建表。

create table MyDB.TEST (
 Col1 String,
 Col2 String,
 Col3 String,
 Col4 String)
 STORED AS INPUTFORMAT
       'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat'
 OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat';

将数据加载到表中。

LOAD DATA INPATH '/hdfs/dir/folder/to/orc/files/' INTO TABLE MyDB.TEST;

相关问题