我还没有任何运气完成一个任务,我想子集化Pandas Dataframe 到一个值,并按他们的id分组。在实际的数据集中,我有几列在'id'和'status'之间
例如:
d = {'id': [1,1,1,1,1,1,1,2,2,2,2,2,2,2], 'status': [0,0,0,0,1,1,1,0,0,0,0,1,0,1]}
df = pd.DataFrame(data=d)
id status
0 1 0
1 1 0
2 1 0
3 1 0
4 1 1
5 1 1
6 1 1
7 2 0
8 2 0
9 2 0
10 2 0
11 2 1
12 2 0
13 2 1
所需子集为:
id status
0 1 0
1 1 0
2 1 0
3 1 0
4 1 1
5 2 0
6 2 0
7 2 0
8 2 0
9 2 1
型
1条答案
按热度按时间u1ehiz5o1#
让我们试试
groupby
+cumsum
:下面是执行
groupby
以创建用作索引器的掩码的替代方法: