如何将文件夹从internet下载到hdfs？

y3bcpkx1 于 2021-06-02 发布在 Hadoop

关注(0)|答案(0)|浏览(314)

我在internet上有一个文件夹，希望将其复制到hadoop群集。文件应通过http协议下载。我可以创建一个java应用程序，它可以遍历文件夹，获取文件夹结构，并在hdfs上创建相应的结构，然后将文件逐个下载到我的机器上，然后上传到服务器上。有没有更干净的方法来完成这样的任务而不必在本地下载？
我试过这样的命令

wget -r --no-parent https://example.org/other/2009/2009-01/ -O - |hadoop fs -put -  /user/beni/deleteme3/

但没用

hadoop hdfs

来源：https://stackoverflow.com/questions/30262414/how-to-download-a-folder-from-internet-to-hdfs

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

如何将文件夹从internet下载到hdfs？

暂无答案！

相关问题

热门标签

最新问答