(ABC,****,tool1,12)
(ABC,****,tool1,10)
(ABC,****,tool1,13)
(ABC,****,tool2,101)
(ABC,****,tool3,11)
以上是输入数据
以下是我在pig中的数据集。
架构为:用户名、ip、工具、持续时间
我想添加相同工具的持续时间
输出
(ABC,****,tool1,35)
(ABC,****,tool2,101)
(ABC,****,tool3,11
(ABC,****,tool1,12)
(ABC,****,tool1,10)
(ABC,****,tool1,13)
(ABC,****,tool2,101)
(ABC,****,tool3,11)
以上是输入数据
以下是我在pig中的数据集。
架构为:用户名、ip、工具、持续时间
我想添加相同工具的持续时间
输出
(ABC,****,tool1,35)
(ABC,****,tool2,101)
(ABC,****,tool3,11
1条答案
按热度按时间odopli941#
在持续时间上使用group by和sum。