我有一个类Dimensions(Int,Int,Int)和一个Shape(字符串名称),放入一个Tuple(Shape,Dimensions)
我的数据集是:
(Cube, Dimensions(5,5,5))
(Sphere, Dimensions(5,10,15))
(Cube, Dimensions(3,3,3))
我需要退还这个:
(Cube, Dimensions(8,8,8))
(Sphere, Dimensions(5,10,15))
其中,我按形状的名称分组,然后将所有尺寸值相加。目前我能够Map到(name,Int,Int,Int),但我不确定如何将其 Package 回Dimension对象。
data.map(_._2.map(x => (x.length,x.width,x.height)))
如有任何帮助,我们将不胜感激
1条答案
按热度按时间fykwrbwg1#
假设没有非常特定的特殊情况,并且您有RDD。你只需要一台
aggregateByKey
。