我已经清理了一个有多个列和~3000行的DF。一列有一个包含各种文本和分隔符的sting。我需要对字符串中的值执行计算。
| 色谱柱A| B栏|
| --------------|--------------|
| abc:208 V,60 A,三相,abcd| 1|
| KW:|六百|
在第1行中,我需要通过grep/regex-ing值来计算KW。(P = V * A)。完成后,我想使用Pandas、numpy和matplotlib运行其他报告/分析
什么是最好的方法。我的理解是,迭代DF不是最好的解决方案?我是否应该转储这个文件,迭代数据并重新导入到一个新的DF?
干杯!
新的和无知的,需要建议。:—)
1条答案
按热度按时间e0bqpujr1#
假设A列中的每一行都有
[volts]V, [amps]A
模式,我们可以将df.str.extract
与相关的正则表达式模式一起使用,将结果表转换为浮点型,然后在列之间取乘积。