//#我有一个fASTA文件,我想把它放在一个有4列的表中
代码安装包(“seqinr”)
library("seqinr")
dnaseq<- read.fasta(file = "C:/Users/user/Downloads/my.fasta")
rows = 4:nrow(dnaseq)
dff<-data.frame(ID = gsub(">","",as.character(dnaseq[rows %% 4==3,3])),names= dnaseq[rows %% 4==2,3],specie= dnaseq[rows %% 4==1,3], sequences = dnaseq[rows %% 4==0,3])
rslt视图(dff)表中无可用数据
我尝试过库(phylotools)fasta.df = read.fasta(“C:/用户/用户/下载/我的.fasta”,名称=['ID','名称','物种','序列'])#结果
fasta.df = read.fasta(“C:/用户/用户/下载/我的.fasta”,名称=['ID','名称','物种','序列'])错误:在“fasta.df = read.fasta(“C:/用户/用户/下载/我的.fasta”中出现意外的“[”,名称=[”
1条答案
按热度按时间jv4diomz1#
我希望您已经从gencode下载了fasta文件
Fasta文件看起来像这样
加载所需的包
首先,我们将fasta文件读入R
将所述报头信息提取到 Dataframe 中
将列名更改为target_id
将所述标头信息拆分成多个列
仅选择所需列