pig:如何重新采样时间序列数据?

0ejtzxu1  于 2021-06-02  发布在  Hadoop
关注(0)|答案(1)|浏览(310)

我有一个非常大的数据集,我正在处理 Pig .
数据包含 timestamp (直到第二个频率),并且我想以分钟频率聚合我的数据(计算每个minnute的观察次数,平均该分钟内的其他变量)。
有没有可能用 Pig ? 谢谢!

smtd7mpg

smtd7mpg1#

您可以修改时间戳字段(生成新字段,如yyyymmddhhmmss到yyymmddhhmm),然后按时间戳分组并聚合数据。

相关问题