我想识别三列中的重复值,并在另一列的结果中求和+1。
# This is my data frame,
# I want to identify duplication in column1, column2 and column3
d = {
'Column1': ['1', '1', '2','3'],
'column2': [101, 101, 234, 203],
'column3': ['c', 'c', 'd','c'],
'columnx': ['0.1', '0.2', '0.1','0.2']}
Column1 column2 column3 columnx
0 1 101 c 0.1
1 1 101 c 0.2
2 2 234 d 0.1
3 3 203 c 0.2
预期结果
Column1 column2 column3 columnx
0 1 101 c 1.1
1 1 101 c 1.2
2 2 234 d 0.1
3 3 203 c 0.2
4条答案
按热度按时间q9rjltbz1#
您可以首先使用
DataFrame.duplicated(keep=False)
查找所有重复的行,然后有条件地分配求和结果dsf9zpds2#
首先将columnx转换为numeric:
接下来,调用
duplicated
(返回bools)并将其添加回:这将就地更新DataFrame。
yfjy0ee73#
试试这个:
6rqinv9w4#
输出: