hadoop文件系统-如何删除给定hdfs目录中大小为零的所有文件?

sqyvllje  于 2021-06-02  发布在  Hadoop
关注(0)|答案(2)|浏览(563)

我在路径:/user/a中有一个hdfs目录a
如何删除文件中所有大小为零的文件?

p5cysglq

p5cysglq1#

这也许有用 hdfs dfs -ls -R /path/to/directory/ | grep part- | awk '{ if ($5 == 0) print $8 }' | xargs hdfs dfs -rm

y1aodyip

y1aodyip2#

仅删除文件:

hdfs dfs -rm $(hdfs dfs -ls -R /user/A/ | grep -v "^d" | awk '{if ($5 == 0) print $8}')

首先测试你得到什么,因为有很多hdfs格式,可能有元数据或0字节大小的文件(比如parquet..success,..temporary等等)

hdfs dfs -ls -R /user/A/ | grep -v "^d" | awk '{if ($5 == 0) print $8}'

相关问题