所以我正在研究的集群有一个条件。任何东西都不能从集群中取出到linux box。构建配置单元表的文件采用顺序文件格式或文本格式。我需要将这些文件更改为csv格式,而不将它们输出到linux-box,而且我还可以从现有的表中创建表,如果可能的话,这些表可以存储为csvfile(我不确定我是否能做到)。我试过很多东西…但是如果不把它输出到linux-box就做不到。感谢您的帮助。
oiopk7p51#
您可以创建另一个配置单元表,如下所示:
CREATE TABLE hivetable_csv ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' LINES TERMINATED BY '\n' as select * from hivetable;
然后将表内容复制到新目录
hadoop fs -cat /user/hive/warehouse/csv_dump/* | hadoop fs -put - /user/username/hivetable.csv
或者,你也可以试试
hadoop fs -cp
1条答案
按热度按时间oiopk7p51#
您可以创建另一个配置单元表,如下所示:
然后将表内容复制到新目录
或者,你也可以试试