我有一个非常大的数据集,我正在处理 Pig .数据包含 timestamp (直到第二个频率),并且我想以分钟频率聚合我的数据(计算每个minnute的观察次数,平均该分钟内的其他变量)。有没有可能用 Pig ? 谢谢!
Pig
timestamp
smtd7mpg1#
您可以修改时间戳字段(生成新字段,如yyyymmddhhmmss到yyymmddhhmm),然后按时间戳分组并聚合数据。
1条答案
按热度按时间smtd7mpg1#
您可以修改时间戳字段(生成新字段,如yyyymmddhhmmss到yyymmddhhmm),然后按时间戳分组并聚合数据。