我试图得到这个数据框的第三列,给出前两列。
我不知道该搜索什么,它就像groupby('group')['weeklyTotal'].cumsum()
的内部版本??
我知道我可以取出这两列,使它们不同,然后做groupby cumsum,但更喜欢在同一个dataframe中。
为了保存一点痛苦,这里有一个示例dataframe:df = pd.DataFrame({'group':['A','A','A','B','B','B','C','C','C'], 'weeklyTotal':[1,1,1,3,3,3,2,2,2]})
| 集团|每周总计|累计总计|
| - -----|- -----|- -----|
| 一个|一个|一个|
| 一个|一个|一个|
| 一个|一个|一个|
| B| 3| 4|
| B| 3| 4|
| B| 3| 4|
| C类|2|六|
| C类|2|六|
| C类|2|六|
2条答案
按热度按时间xlpyo6sf1#
每组只保留一行
drop_duplicates
,计算cumsum
和map
的值:或者,使用
mask
和duplicated
:输出:
kyvafyod2#
这里是另一种方法:
输出: