如何根据列值只删除PandasDataFrame中的相邻行(除一行外的所有行)？

c2e8gylq 于 2022-12-09 发布在其他

关注(0)|答案(1)|浏览(139)

我有一个DataFrame，看起来像这样：

Column1  Column2 
0     cat        A 
1     cat        B 
2     cat        C 
3     dog        D 
4     dog        E 
5     cat        F

我想删除第1列中有重复值的所有连续行，只保留其中一行。因此，我想删除第1、2和4行，但我想保留第0、3和5行。如果我没有弄错的话，drop_duplicates几乎可以正常工作，但会删除第5行。猫和狗可能会在后面的行中多次出现，但我只想保留任何连续行中的一行。
我尝试了df.drop_duplicates（subset ='cat'，keep ='first'），但是它删除了第5行。

pandas

来源：https://stackoverflow.com/questions/74720000/how-do-i-drop-only-contiguous-rows-all-but-one-in-a-pandas-dataframe-according

1条答案

按热度按时间

xxslljrj1#

您可以用途：

out = df.groupby(df['Column1'].ne(df['Column1'].shift()).cumsum()).head(1)

输出量：

Column1 Column2
0     cat       A
3     dog       D
5     cat       F

赞(0）回复(0）举报 2022-12-09

我来回答

如何根据列值只删除PandasDataFrame中的相邻行(除一行外的所有行)？

1条答案

相关问题

热门标签

最新问答