我想在现有列的基础上添加一个索引列。重复项将共享同一索引。例如在此处输入图像描述如果两列['old_index','year']的值相同,则新索引将相同。“num”列中的值无关紧要。我想知道是否有人能帮忙。非常感谢你!
fhg3lkii1#
df['new_id'] = df.groupby(df.columns.tolist(), sort=False).ngroup() + 1 df index year id new_id 0 1 2000 5 1 1 2 1996 3 2 2 2 1996 3 2 3 4 1994 2 3 4 4 1999 4 4 5 4 1999 4 4 6 12 1989 1 5 7 12 1989 1 5 8 12 1985 0 6 9 12 2011 6 7
试试看,如果不是你想要的,请告诉我。
1条答案
按热度按时间fhg3lkii1#
试试看,如果不是你想要的,请告诉我。