我有一个数据框,看起来像这样
Chrom Pos Ref Alt sample_id cluster_id cellular_prevalence
1 chr11 70176412 C G SRC125_1 0 0.5389
8 chr12 10370686 G A SRC125_1 0 0.5389
15 chr12 40892074 T A SRC125_1 0 0.5389
22 chr12 53663629 G T SRC125_1 0 0.5389
29 chr13 103387098 C T SRC125_1 0 0.5389
36 chr13 24334244 G T SRC125_1 0 0.5389
....
....
Chrom Pos Ref Alt sample_id cluster_id cellular_prevalence
1086 chr3 12531337 G C SRC125_1 6 0.2675
1093 chr3 12531455 G C SRC125_1 6 0.2675
1100 chr3 12531462 G A SRC125_1 6 0.2675
1107 chr5 178460018 T A SRC125_1 6 0.2675
1114 chr5 180048230 C T SRC125_1 6 0.2675
群集总数:
unique(my_data$cluster_id)
0 1 2 3 4 5 6 7
我想删除每个sample_id只有一个突变的聚类,并根据删除的聚类重命名这些聚类。就像我的数据集中的一个示例一样,聚类2每个sample_id只有一个突变,我删除了它,现在想在删除cluster 2后重命名这些聚类,这样聚类3将重命名为cluster 2,聚类4 -〉cluster 3,聚类5 -〉cluster 4,依此类推
在R里怎么做?
1条答案
按热度按时间3qpi33ja1#
假设您已经按照注解中的指示删除了不需要的集群,剩下的问题只是重命名集群。
为此,我们可以在排列好的数据集上使用
dplyr
中的cur_group_id
。