how to unzip a bz2 file in HDFS System wanted to upload this.csv file into a table that i create in hive2003.csv.bz2我有这个文件zcat 2003.csv.bz2| hdfs dfs -put - /user/$USER/workspace这个我试过了,但不起作用
uqcuzwp81#
HDFS可以本地存储BZ2文件,因此Hive可以读取该存档中的所有CSV数据。或者,更好的做法是,你应该将CSV转换为Avro或Parquet然后上传。这将使你的Hive查询更快否则,hdfs put接受文件,而不是文本输入流
hdfs put
1条答案
按热度按时间uqcuzwp81#
HDFS可以本地存储BZ2文件,因此Hive可以读取该存档中的所有CSV数据。
或者,更好的做法是,你应该将CSV转换为Avro或Parquet然后上传。这将使你的Hive查询更快
否则,
hdfs put
接受文件,而不是文本输入流