我有一个包含序列和基因名称的csv文件。我想从用户输入并打印所有包含用户输入的行作为一部分。作为一个例子,我的数据是;
Gene 1 ATGCGGTCTA
Gene 2 ACGCCCATGA
Gene 3 TCGAC
当用户进入GC时,结果必须为
Gene 1 ATGCGGTCTA
Gene 2 ACGCCCATGA
因为两者在序列中都具有GC。
到目前为止我尝试;
import csv
import sys
import pandas as pd
csv_file = csv.reader(open('DATA.csv', "r"), delimiter=",")
z=input('what would you like to search?').lower()
if z=='sequence':
s=input('Enter sequence : ').upper()
df = pd.read_csv('DATA.csv')
a = list(df['seq'])
b = ' '.join(str(s) for s in a)
c= b.find(s)
1条答案
按热度按时间guz6ccqo1#
使用
pandas
并假设包含序列的 Dataframe 的列名为sequences
,您可以执行以下操作:filtered_df = df[df['sequences'].str.contains(s)]