将文件加载到hadoop中

ukdjmx9f  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(305)

我有一个包含本地文件系统数据的目录结构。我需要把它复制到hadoop集群。
目前我找到了三种方法:
使用“hdfs dfs-put”命令
使用hdfs-nfs网关
在每个数据节点上通过nfs挂载我的本地目录并使用distcp
我还缺什么工具吗?哪一个是最快的复制方式?

yzckvree

yzckvree1#

我想 hdfs dfs -put 或者 hdfs dfs -copyFromLocal 这是最简单的方法。
如果你有很多数据(很多文件),你可以用编程的方式复制它们。

FileSystem fs = FileSystem.get(conf);
fs.copyFromLocalFile(new Path("/home/me/localdirectory/"),   new Path("/me/hadoop/hdfsdir"));

相关问题