我有一个数据源,我定期下载到一个csv。它看起来像这样
TABLE # 196712 / 9000_
>= 10 : 0.002
>= 5 : 0.001
>= 2 : 0.0005
>= 1 : 0.0002
>= 0.5 : 0.0001
>= 0.2 : 0.0001
>= 0.1 : 0.0001
>= 0.0001 : 0.0001
TABLE # 196714 / Dark
>= 0.0001 : 5e-05
TABLE # 196715 / GBD
>= 25 : 0.01
>= 10 : 0.005
>= 5 : 0.0025
>= 0.1 : 0.001
>= 0.0005 : 0.005
我希望解析文件并将数据分类到字典中,其中哈希后面的数字是唯一的id(新的dict键),后面的行(以〉=开头)是卷数加上相关的惩罚值。
s.th 像这样的工作方式:
{196712: [(10,0.002),(5,0.001),(2,0.0005),(1,0.0002),(0.5,0.0001),(0.2,0.0001),(0.1,0.0001),(0.0001, 0.0001)],
196714: [(0.0001,5e-05)],
196715: [(25,0.01),(10,0.005),(5,0.0025),(0.1,0.001),(0.0005,0.005)]}
我在python外部过滤它的方法是使用grep并得到以下几行,但是ID之间的行数不同会使它变得更加复杂,也可以使用任何其他建议的更方便的数据结构。
2条答案
按热度按时间x4shl7ld1#
试试看:
印刷品:
jmp7cifd2#
运行它: