我想得到一个dataframe的计数的总金额的项目出售的一天,但在“结束”的一天。
例如,我有以下数据:
Item Day Facility
Item_A Day1 B
Item_B Day1 A
Item_B Day1 B
Item_C Day2 B
Item_A Day2 A
Item_C Day2 C
Item_B Day2 A
Item_B Day2 A
Item_C Day3 A
我想一个表,显示了总销售项目在一天结束+前几天。我已经包括了一个虚拟列,因为我的数据有额外的列,我不需要。
例如:
Item Day Facility Item_Total_Accumulative
Item_A Day1 B 1
Item_B Day1 A 2
Item_B Day1 B 2
Item_C Day2 B 2
Item_A Day2 A 2
Item_C Day2 C 2
Item_B Day2 A 4
Item_B Day2 A 4
Item_C Day3 A 3
2条答案
按热度按时间vltsax251#
您可以使用
group_by()
和mutate()
(或count()
)来计算每天和每项,并且对于计算,我认为函数cumsum()
将是适当的(累积和)。因为你的变量
Facility
不是一个数字,我添加了一个变量Value = 1
,但使用count()
是一个更好的方法(与注解行相同的结果)。然后用前面的结果做一个
left_join()
,你就得到了你想要的。lp0sw83n2#
应该有一个更简单的方法,但我的快速涂鸦是这样的:
创建于2019-06-05由reprex package(v0.3.0)