我们如何计算hdfs文件夹中按日期分组的文件数?
Example: 2020-01-03 10:00:00 - file 1 2020-01-03 11:00:00 - file 2 2020-01-03 12:00:00 - file 3 2020-02-03 10:00:00 - file 4 Expected result: 3 2020-01-03 1 2020-02-03
wixjitnu1#
你可以用下面的命令来做。这个 stat "%y" 命令帮助您获得修改日期和 cut -d' ' -f1|sort|uniq -c 将剪切日期、排序并计算唯一值。
stat "%y"
cut -d' ' -f1|sort|uniq -c
hdfs dfs -stat "%y" path | cut -d' ' -f1|sort|uniq -c
1条答案
按热度按时间wixjitnu1#
你可以用下面的命令来做。这个
stat "%y"
命令帮助您获得修改日期和cut -d' ' -f1|sort|uniq -c
将剪切日期、排序并计算唯一值。