错误的Python正则表达式？

g6ll5ycj 于 2023-03-11 发布在 Python

关注(0)|答案(1)|浏览(105)

import re
contents="""<tag>
</tag><t>text</t>"""

shorted= re.sub(r'(?s)<tag>.*?</tag>[^\w\s]*', '', contents).replace('\n', '')
print(shorted)
print()

结果：

t>text</t>

应为“<t>text</t>“，但缺少“<t>“的第一个“<“，为什么？

python

来源：https://stackoverflow.com/questions/75700110/malformed-python-regex

1条答案

按热度按时间

z4iuyo4d1#

我推荐使用XML解析器来处理XML，但是如果您更喜欢re，可以尝试re.compile()和findall()：

import re
contents="""<tag>
</tag><t>text</t>"""

pattern = re.compile("<t>.*")
out = re.findall(pattern, contents)
print(out[0])

输出：

<t>text</t>

赞(0）回复(0）举报 2023-03-11

我来回答

错误的Python正则表达式？

1条答案

相关问题

热门标签

最新问答