我有一个数据集,想删除重复的值,但保留这些行。这是我的:
df =
id column_a column_b column_c name
101 abc def ghi adam
101 abc def ghi brook
101 abc def ghi chris
字符串
我只想保持最上面的一行不变,但所有其他具有相同id
值的行都删除了所有值,但没有删除行,只留下id
和name
列。就像这样:
id column_a column_b column_c name
101 abc def ghi adam
101 brook
101 chris
型
我做了df['column_a'] = np.where(df['id'] = df['id'].shift(1), '', df['column_a']
,这似乎起作用了,我只是想找到一种更有效的方法来做到这一点。- 谢谢你-谢谢
1条答案
按热度按时间6kkfgxo01#
您可以使用
duplicated
来mask
所需的列:字符串
输出量:
型
每组:
型
示例如下:
型