我有这样一个 Dataframe :
df=pd.DataFrame({'id':[100,100,100,100,100,100,100,100,100,100,100,200,200,200,200,200,200]})
'''
id
0 100
1 100
2 100
3 100
4 100
5 100
6 100
7 100
8 100
9 100
10 100
11 200
12 200
13 200
14 200
15 200
'''
我想使用id列每5个条目分配一个新的id。例如,预期输出:
out=pd.DataFrame({'100_1','100_2','200_1'})
'''
0
0 100_1 #100 is id. _1 is which group. (0-5)
1 100_2 #_2 is second period of 5. (5-10)
2 200_1
'''
例如,如果有15个相同的id(假设id=400),输出应该如下所示:第一个月
2条答案
按热度按时间3ks5zfa01#
我能想到的一个不太优雅的解决方案是使用cumcount()
soat7uwm2#
这可能行得通: