hadoop从hdfs中现有归档文件获取文件

3b6akqbq  于 2023-01-15  发布在  HDFS
关注(0)|答案(1)|浏览(219)

我有一个目录“SmallFiles”,其中包含8个文件,我使用“hadoop archive -archiveName myArch.har -p /Files/SmallFiles /Files”将它们存档,然后删除了原始文件。我想知道如何再次提取文件?
当我下载它时,我得到这3个文件“索引,主索引,部分-0”

dgiusagp

dgiusagp1#

您需要通过har:// URI访问存档文件。
因此,使用以下文件归档:将使用hadoop dfs -lsr har:///user/zoo/foo.har/访问hadoop archive -archiveName foo.har -p /user/hadoop dir1 dir2 /user/zoo
我认为这里的文档很简单:https://hadoop.apache.org/docs/current/hadoop-archives/HadoopArchives.html

相关问题