如何在hdfs中获取配置单元表输出或文本文件,在hdfs中配置单元表被创建为.csv格式

blmhpbnm  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(360)

所以我正在研究的集群有一个条件。任何东西都不能从集群中取出到linux box。
构建配置单元表的文件采用顺序文件格式或文本格式。
我需要将这些文件更改为csv格式,而不将它们输出到linux-box,而且我还可以从现有的表中创建表,如果可能的话,这些表可以存储为csvfile(我不确定我是否能做到)。
我试过很多东西…但是如果不把它输出到linux-box就做不到。感谢您的帮助。

oiopk7p5

oiopk7p51#

您可以创建另一个配置单元表,如下所示:

CREATE TABLE hivetable_csv ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n' as 
select * from hivetable;

然后将表内容复制到新目录

hadoop fs -cat /user/hive/warehouse/csv_dump/* | hadoop fs -put - /user/username/hivetable.csv

或者,你也可以试试

hadoop fs -cp

相关问题