pandas 替换列中的部分字符串

s5a0g9ez  于 2023-05-12  发布在  其他
关注(0)|答案(1)|浏览(209)

我想在Python中删除pandas Dataframe 中的部分字符串。该列包含指定期间发票行。请看下面。我想删除这部分[*]之间的部分。图像数据集(https://i.stack.imgur.com/fdCnV.png
我尝试了str replace方法。df['Description_GLEntry'].str.replace('[Jan 01, 2022 - Jan 31, 2022]', '')。这将删除文本,但只留下[-],并且它不会专门删除[*]。我的计划是让它在def函数中使用循环。

uurv41yg

uurv41yg1#

我们可以使用以下正则表达式替换:

df["Description_GLEntry"] = df["Description_GLEntry"].str.replace(r'\s*\[\w{3} \d{2}, \d{4} - \w{3} \d{2}, \d{4}\]$', '', regex=True)

下面是一个regex demo,它显示了替换逻辑对测试数据的作用。

相关问题