我有一个天线结果的模拟结果,可以在here中找到
您可以看到,我需要重新塑造这些数据,以便发生三件事:
- 标题的格式为
Var(extraInfo)[unit]
,从第一列和第三列可以看出,括号有时是可选的 - 第二行被删除(
---
) - 然后将数据正确分配给每个标题列,这可以通过`delim_whitespace=True轻松完成)
第一个和第二个主题对我来说似乎很困惑(至少从哪里开始)。
到目前为止,我也有一个解决方法,要求我每次都输入这个(我想让这个更加自动化,因此我的帖子)。我基本上忽略了前两行,然后手动输入变量名
import pandas as pd
df = pd.read_csv('Results.txt', skiprows=2, delim_whitespace=True, lineterminator='\n',header =None)
df = df.drop(8, axis=1)
df.rename(columns={0: 'V1', 1: 'V2', 2: 'V3', 3: 'V4', 4: 'V5',5: 'V6', 6: 'V7', 7: 'V8'}, inplace=True)
1条答案
按热度按时间eivnm1vs1#
我一直在研究这个代码。您可以检索数据集here的示例。粘贴到记事本上并保存为
.txt
以进行复制。由于我想自由地使用不同的列,我决定从pandas
移到numpy
,这让事情变得更容易处理(特别是因为所有的处理最终都是numpy数组)。如果您查看创建的数组,您可以看到您可以按照我最初的期望选择列,方法是: