我有一个数据集,我需要得到一个计数的报告,我正在使用Map,但似乎没有工作。
样本数据:
ID Manager_ID Manger_Pos_Num
101 103 1111
102 103 1111
103 106 2222
104 103 3333
105 106 2222
106
所需输出:
ID Reports
101 0
102 0
103 2
103 1
104 0
105 0
106 2
我在用
counts = df.groupby('Manager_Pos_Num')['ID'].nunique()
df['Reports'] = df['ID'].map(counts).fillna(0).astype(int)
当我使用这个我得到所有的零我不知道为什么我已经检查了计数变量,这工程我不知道,如果它的Map功能或没有任何建议?
我使用Manager_Pos_Num
而不是ManagerID
进行计数,因为我想看看该管理器是否在另一个Manager_Pos_Num
中。
1条答案
按热度按时间ubby3x7f1#
你试图计算唯一对
(Manager_ID, Manger_Pos_Num)
的数量,所以groupby().size()
,然后merge
而不是map
,因为你在新数据上有重复的ID
(例如103
):输出: