如何根据重复值过滤 Dataframe ？[duplicate]

dy1byipe 于 2023-03-10 发布在其他

关注(0)|答案(3)|浏览(116)

此问题在此处已有答案：

how to remove unique entry and keep duplicates in R（3个答案）
3天前关闭。
我有这个df

df = data.frame(x = c(1,1,2,2,3,4),
                y = LETTERS[1:6] )

所需输出为

x y
1 1 A
2 1 B
3 2 C
4 2 D

我尝试使用filter函数，但没有得到我想要的结果。
谢谢。

来源：https://stackoverflow.com/questions/75652520/how-to-filter-a-dataframe-based-on-the-duplicated-values

3条答案

按热度按时间

v6ylcynt1#

含碱基R

> subset(df, duplicated(df$x)| duplicated(df$x, fromLast = TRUE))
  x y
1 1 A
2 1 B
3 2 C

赞(0）回复(0）举报 2023-03-10

l5tcr1uw2#

可以按组使用n()：

library(dplyr) #1.1.0 needed or above
df %>% 
  filter(n() > 1, .by = x)

  x y
1 1 A
2 1 B
3 2 C
4 2 D

或者，在base R中：

subset(df, ave(x, x, FUN = length) > 1)

在data.table中：

setDT(df)[, if(.N > 1) .SD, x]

赞(0）回复(0）举报 2023-03-10

hfyxw5xn3#

如果我们按单个列分组，则n（）〉1的所有组都具有该列的“重复”值

library(dplyr)

df %>%
    group_by(x) %>%
    filter(n()>1) %>%
    ungroup()

# A tibble: 4 × 2
      x y    
  <dbl> <chr>
1     1 A    
2     1 B    
3     2 C    
4     2 D

赞(0）回复(0）举报 2023-03-10

我来回答

如何根据重复值过滤 Dataframe ？[duplicate]

3条答案

相关问题

热门标签

最新问答