hadoop—如何下载tar.gz并将其打包到hdfs,而不将整个文件下载到本地磁盘?

c7rzv4ha  于 2021-06-01  发布在  Hadoop
关注(0)|答案(1)|浏览(581)

我想将tar.gz文件从web直接提取到hdfs中。跳过下载到本地磁盘阶段,因为文件可能非常大。
这一切都来自简单的命令行脚本(bash、wget等)

rmbxnbpk

rmbxnbpk1#

好吧,看起来这个班轮很管用:

wget -O - http://...tar.gz | tar xfz - --to-stodout | hadoop dfs -put - /somepath

相关问题