我最近在伪分布式模式下设置了hadoop,并创建了数据并将其加载到hdfs中。后来因为一个问题,我格式化了namenode。现在当我这么做的时候,我发现在datanodes上已经存在的目录和文件不再显示了(“格式化”这个词是有道理的)但现在,我有这个疑问。由于namenode不再保存文件的元数据,对先前加载的文件的访问是否被切断?如果是,那么我们如何删除datanodes上已经存在的数据?
mutmk8jj1#
您以前的datanode目录现在已过时,是的。您需要手动遍历每个datanode并删除这些目录的内容。通过hadoop cli没有这样的格式化命令默认情况下,数据节点目录是/tmp下的单个文件夹否则,您已经将xml文件配置为存储数据的位置hdfs存储数据的位置
1条答案
按热度按时间mutmk8jj1#
您以前的datanode目录现在已过时,是的。
您需要手动遍历每个datanode并删除这些目录的内容。通过hadoop cli没有这样的格式化命令
默认情况下,数据节点目录是/tmp下的单个文件夹
否则,您已经将xml文件配置为存储数据的位置
hdfs存储数据的位置