我有一个像这样的有30000行的框架:
gene logFC adj.p.val disease
1 SYT11 1.9678590 3.542121e-09 DN
2 PPT1 0.7349565 5.239188e-09 DN
3 PHLDA2 2.7419282 5.478323e-08 DN
4 TGFBI 1.6491225 5.478323e-08 DN
5 CRIP1 1.6476587 2.342271e-07 DN
6 TIGAR 1.2751720 2.342271e-07 DN
字符串
疾病等级栏为
levels(as.factor(pfilter_hdata$disease))
[1] "DN" "FSGS" "FSGS-MCD" "HN" "IgAN" "LN" "MCD" "MGN" "RPGN"
型
我想做的是提取每种疾病与所有其他疾病的独特基因。例如,在DN的情况下,我想创建一个文件,其中包含DN中存在的所有基因,而不是所有其他疾病。我如何在R中做到这一点?
1条答案
按热度按时间mnemlml81#
您可以将数据透视得更宽,并过滤总和仅为1的行:
字符串
另一种选择是总结独特基因的数量,如果超过1,则进行过滤:
型
第二种方法可能更有效。