如何知道使用pandas删除的行数

egmofgnx 于 2021-06-23 发布在 Mysql

关注(0)|答案(1)|浏览(473)

从这个2.csv文件过滤完成，常见的emailid被删除，我可以得到删除后的总数，但有没有任何选项，给出多少行被删除使用Pandas。
使用mysql：从dataa，data1b中删除a，其中a.email=b.email；选择行计数（）；如何使用Pandas来实现这一点

import pandas as pd

colnames=['id','emailid']

data=pd.read_csv("input.csv",names=colnames,header=None)

colnames=['email']

data1= pd.read_csv("compare.csv",names=colnames,header=None)

emailid_suppress1=data1['email'].str.lower()

suppress_md5=data[~data['emailid'].isin(emailid_suppress1)]

print suppress_md5.count()

mysql pandas python-2.7 pymysql

来源：https://stackoverflow.com/questions/50559776/how-to-know-the-count-of-number-of-rows-deleted-using-pandas

1条答案

按热度按时间

o0lyfsai1#

我相信我们需要 sum 的 True s值的过程，如 1 :

data = pd.DataFrame({'id':list('abcde'), 'emailid':list('klmno')})
print (data)
  id emailid
0  a       k
1  b       l
2  c       m
3  d       n
4  e       o

data1 = pd.DataFrame({'email':list('ABCKLDEFG')})
print (data1)
  email
0     A
1     B
2     C
3     K
4     L
5     D
6     E
7     F
8     G

emailid_suppress1=data1['email'].str.lower()

print ((~data['emailid'].isin(emailid_suppress1)).sum())
3

suppress_md5=data[~data['emailid'].isin(emailid_suppress1)]
print (suppress_md5)
  id emailid
2  c       m
3  d       n
4  e       o

编辑：

print ((data['emailid'].isin(emailid_suppress1)).sum())
2

suppress_md5=data[data['emailid'].isin(emailid_suppress1)]

print (suppress_md5)
  id emailid
0  a       k
1  b       l

赞(0）回复(0）举报 2021-06-23

我来回答

如何知道使用pandas删除的行数

1条答案

相关问题

热门标签

最新问答