tools.jar从parquet文件中转储特定于hadoop的列

kyks70gy  于 2021-05-29  发布在  Hadoop
关注(0)|答案(2)|浏览(513)

我只想使用parquet-tools-1.8.1.jar在某个文本文件中转储一个特定的列,但不能这样做。我在命令之下努力。请注意我的列名有正斜杠。

parquet-tools-1.8.1.jar dump --column 'dir1/log1/job12121' '/hdfs-path/to/parquet file with space.parquet' > /home/local/parquet/output.text
uqdfh47h

uqdfh47h1#

请使用以下选项:
hadoop jar parquet-tools-1.8.1.jar dump-c dir1 log1 job12121-m/hdfs path/to/parquet文件with space.parquet>>/home/local/parquet/output.text
note:no single 输入参数的引号。

oxcyiej7

oxcyiej72#

hadoop jar parquet-tools-1.8.1.jar parquet.tools.Main dump --column 'dir1/log1/job12121' '/hdfs-path/to/parquet file with space.parquet' > /home/local/parquet/output.text

相关问题