如何计算hdfs中按日期分组的文件数

qyzbxkaa  于 2021-07-15  发布在  Hadoop
关注(0)|答案(1)|浏览(429)

我们如何计算hdfs文件夹中按日期分组的文件数?

Example:
2020-01-03 10:00:00 - file 1
2020-01-03 11:00:00 - file 2
2020-01-03 12:00:00 - file 3
2020-02-03 10:00:00 - file 4

Expected result:
3 2020-01-03
1 2020-02-03
wixjitnu

wixjitnu1#

你可以用下面的命令来做。这个 stat "%y" 命令帮助您获得修改日期和 cut -d' ' -f1|sort|uniq -c 将剪切日期、排序并计算唯一值。

hdfs dfs -stat "%y" path | cut -d' ' -f1|sort|uniq -c

相关问题