pandas DF是由字符串值组成的,需要grep/regex字符串并计算

dy2hfwbg  于 2023-05-15  发布在  其他
关注(0)|答案(1)|浏览(161)

我已经清理了一个有多个列和~3000行的DF。一列有一个包含各种文本和分隔符的sting。我需要对字符串中的值执行计算。
| 色谱柱A| B栏|
| --------------|--------------|
| abc:208 V,60 A,三相,abcd| 1|
| KW:|六百|
在第1行中,我需要通过grep/regex-ing值来计算KW。(P = V * A)。完成后,我想使用Pandas、numpy和matplotlib运行其他报告/分析
什么是最好的方法。我的理解是,迭代DF不是最好的解决方案?我是否应该转储这个文件,迭代数据并重新导入到一个新的DF?
干杯!
新的和无知的,需要建议。:—)

e0bqpujr

e0bqpujr1#

假设A列中的每一行都有[volts]V, [amps]A模式,我们可以将df.str.extract与相关的正则表达式模式一起使用,将结果表转换为浮点型,然后在列之间取乘积。

df['P'] = df["Column A"].str.extract("(?P<V>\d+)V, (?P<A>\d+)A").astype("float").product(axis=1, skipna = False)

相关问题