regex 如何使用正则表达式只匹配标签之间的标题< h>< /h>，而不返回标签本身？

suzh9iv8 于 2023-03-13 发布在其他

关注(0)|答案(1)|浏览(83)

我希望使用正则表达式将h1的标题与HTML文件中的h6匹配，而不返回h标记本身。
考虑下面这段HTML文件，我想匹配“Welcome to my Homepage”、“SQL”、“RegEx”，但不匹配“This is not a valid HTML”（它被一对不匹配的标记包围）。

<body>
  <H1>Welcome to my Homepage</H1>
  Content is divided into two sections:<br/>
  <h2>SQL</h2>
  Information about SQL.
  <h2>RegEx</h2>
  Information about Regular Expressions.
  <h3>This is not a valid HTML</h4>
</body>

我使用了(?<=<[hH]([1-6])>).*?(?=<\/[hH]\1>) at regex101.com，但是它也可以计算标记<H1>和<h2>中的数字1和2。
怎么解决呢？

regex

来源：https://stackoverflow.com/questions/75691798/how-to-match-only-the-titles-between-h-h-tags-without-returning-the-tags-th

1条答案

按热度按时间

afdcj2ne1#

它还匹配标签<H1>和<h2>中的数字1、2。
不完全是。匹配本身只捕获内容。数字来自你的lookbehind中的捕获组。你可以忽略它。

赞(0）回复(0）举报 2023-03-13

我来回答

regex 如何使用正则表达式只匹配标签之间的标题< h>< /h>，而不返回标签本身？

1条答案

相关问题

热门标签

最新问答