我与盗版数据集有以下字段的关系:
date, country_code, torrent_id, first_seen, torrent_size, quality, movie_id, value
我想按日期、国家、电影和质量进行分组,以计算值的总和。但我也要计算最小,最大,平均洪流大小的电影所有洪流当天可用。
这就是我目前得到的
A = FOREACH (GROUP data BY (date, country_code, movie_id, quality)) {
GENERATE group, SUM(data.value) as total_piracy;
};
然而,我不知道如何做最小,最大,平均大小的影片洪流上的日期提供不顾国家以及。
2条答案
按热度按时间wgxvkvu91#
您可以检查以下命令:
希望这有帮助。
3bygqnnd2#
创建另一个关系并按日期、电影分组,然后获取最小值、最大值、平均值