我需要一个新的列来包含user_id和artist_id相同的次数,例如user_id = 0,artist_id = 10,并且它发生了5次,我需要将数字5存储在发生这种情况的5行中的一列中。这段代码给了我值,但是我不能存储它。
treino.groupby(['user_id', 'artist_id']).count()
ecbunoof1#
IIUC,你需要一个列来表示每行中每个组的大小,然后你需要使用groupby.transform。
groupby.transform
df["group_size"] = ( df.assign(group_size=1) .groupby(["user_id", "artist_id"])["group_size"] .transform("count") )
1条答案
按热度按时间ecbunoof1#
IIUC,你需要一个列来表示每行中每个组的大小,然后你需要使用
groupby.transform
。