piggybank函数,用于获取每组计数的最大计数

ht4b089n  于 2021-05-30  发布在  Hadoop
关注(0)|答案(0)|浏览(210)

我有这种格式的数据

  1. {group: chararray,finalItemsets: {(trans::sale::productId: int,product::serveRegion: chararray)}};

我希望产品在每个组中有最大计数,即我正在尝试获取产品ID

  1. {(trans::sale::productId: int,product::serveRegion: chararray)}

每组最大重复次数和次数。
最终的输出结构可能是这样的- group, productId, maxCount(productId) . 那么,piggybank里有没有让我这么做的自定义项。
希望很快收到你的来信!。

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题