如何读取.orc文件中的表配置单元?

tvmytwxo  于 2021-06-01  发布在  Hadoop
关注(0)|答案(1)|浏览(425)

我有一个.orc文件,有没有办法把它转换成.csv文件?或者是否有其他方法读取此文件中的表?

xlpyo6sf

xlpyo6sf1#

Hive有本机 ORC 支持,因此您可以通过hive直接阅读。
插图:
(例如,文件名为 myfile.orc )
将文件上载到hdfs

hadoop fs -mkdir hdfs:///my_table_orc_file
hadoop fs -put myfile.orc hdfs:///my_table_orc_file

在上面创建一个配置单元表
(更新列定义以匹配数据)

CREATE EXTERNAL TABLE `my_table_orc`(
  `col1` string,
  `col2` string)
STORED AS ORC
LOCATION
  'hdfs:///my_table_orc_file';

查询它

select * from my_table_orc;

相关问题