pandas 比较表A和表B,如果有重复值,则插入表B中定义的代码[duplicate]

vfh0ocws  于 2022-11-20  发布在  其他
关注(0)|答案(1)|浏览(126)

此问题在此处已有答案

Pandas Merging 101(8个答案)
2天前关闭。
我正在尝试比较以下两个表。在比较表B中的单词与表A中的单词之后,我希望将重叠值的代码放在表A的空“代码”列中。由于它不区分大小写,我希望在继续比较之前将所有单词更改为小写。如果它们不匹配,我希望禁用代码注入。
大约有10000条数据

我已经两天没能解决这个问题了。请帮帮我!!

表A
| 编码|职务名称|
| - -|- -|
| | 霍乱|
| | 其他弧菌引起的肠道感染|
| | 伤寒|
| | 伤寒性腹膜炎|
| | 副伤寒|
| | 其他沙门氏菌感染|
| | 肠炎沙门菌|
表B
| 编码|职务名称|
| - -|- -|
| 1A 00年|霍乱|
| 1A 01年|其他弧菌引起的肠道感染|
| 1A 02年|志贺氏菌引起的肠道感染|
| 一年七月|伤寒|
| 1A07.0版|伤寒性腹膜炎|
| 1A 07年|其他特异性伤寒|
| 1A07.Z|未特别指明的伤寒|
结果表
| 编码|职务名称|
| - -|- -|
| 1A 00年|霍乱|
| 1A 01年|其他弧菌引起的肠道感染|
| 一年七月|伤寒|
| 1A07.0版|伤寒性腹膜炎|
| | 副伤寒|
| | 其他沙门氏菌感染|
| | 肠炎沙门菌|

ghhaqwfi

ghhaqwfi1#

首先创建一个小写的新列
然后进行标准合并

df3 = pd.merge(
    df1,
    df2,
    how = 'left',
    on = 'cat',
    suffixes = ['_x', '']
    )[['Code', 'Title_x']].rename(columns = {'Title_x': 'Title'})

相关问题