我有一个包含地址的 Dataframe 。
| 地址|
| - ------|
| 爱丁堡科米斯顿彭特兰大道10号,EH10 6PX。|
| 爱丁堡,爱丁堡国际机场|
| 卡尔顿街|
| 交易所公寓,47 Timber Bush,利思EH6 6QH|
我希望用python和panda编写代码,识别行中是否有'EH',然后将此字符和所有后续字符移到另一列,从而实现以下目的:
| 地址|邮政编码|
| - ------|- ------|
| 10 Pentland Drive,科米斯顿,爱丁堡,.|EH10 6PX战斗机|
| 爱丁堡马里广场|EH3|
| 卡尔顿街||
| 交易所公寓,47 Timber Bush,利思EH6 6QH|EH6 6QH|
有人能帮忙吗?
3条答案
按热度按时间ykejflvf1#
您可以使用
str.extract
:regex demo
或
str.split
,如果至少有一行具有邮政编码:regex demo
输出:
xpcnnkqh2#
使用简单的正则表达式匹配:
qq24tv8q3#
下面是使用正则表达式正前瞻的方法: