我有一个字符串内变量a包含双引号内双引号:
输入:
a = ""comment_text": "Siti Sa"diah I need this for my neighbor needs""
预期结果:
a = ""comment_text": "Siti Sadiah I need this for my neighbor needs""
我试着用
re.sub(r'[^A-Za-z]', '', a)
and I also tried this one:
re.sub('"', '', a)
结果是这样的
commenttextSitiSadiahIneedthisformyneighborneeds
and this
comment_text: Siti Sadiah I need this for my neighbor needs
我想删除双引号(“)只有如果它之间的字母。
我用的是python,有人能找到解决这个问题的方法吗?
多谢了!
2条答案
按热度按时间xriantvc1#
re.sub(r'(\w)"(\w)', r'\1\2', df['comment'])
表示"
周围的任何单词字符crcmnpdw2#
试试这个正则表达式:
\b
称为单词边界,它匹配单词字符和非单词字符之间的位置(在本例中为"
),或者字符串的开头或结尾。Demo here