我有一个.tsv文件,如下所示:
| 序列|标号|
| - -|- -|
| [[0.0,1.0、0.0、0.0]、[0.0、0.0、1.0、0.0]、[0.0、0.0、1.0、0.0]、[0.0、0.0、1.0、0.0]、[0.0、0.0、1.0、0.0]、[0.0、0.0、1.0、0.0]]|一个|
我想将pd.DataFrame中的列sequences
导入为np.float64
。
但事实是这样的:
df = pd.read_csv('AARS.tsv', sep='\t', dtype = np.float64)
ValueError: could not convert string to float
如果你能给予我任何建议,我将不胜感激!
非常感谢!
2条答案
按热度按时间3wabscal1#
第一列看起来不像是
float64
。您可以省略
dtype=...
,并检查数据的类型:这将输出如下所示的内容(当我创建正确的输入时,我添加了一行列标题):
raogr8fs2#
下面是一个用Pandas
StringMethods
和pandas.Series.explode
做的命题:#输出:
如果您需要将数组重新调整为2D,请使用
numpy.reshape
: