regex 如何使用正则表达式只匹配标签之间的标题< h>< /h>,而不返回标签本身?

suzh9iv8  于 2023-03-13  发布在  其他
关注(0)|答案(1)|浏览(84)

我希望使用正则表达式将h1的标题与HTML文件中的h6匹配,而不返回h标记本身。
考虑下面这段HTML文件,我想匹配“Welcome to my Homepage”、“SQL”、“RegEx”,但不匹配“This is not a valid HTML”(它被一对不匹配的标记包围)。

<body>
  <H1>Welcome to my Homepage</H1>
  Content is divided into two sections:<br/>
  <h2>SQL</h2>
  Information about SQL.
  <h2>RegEx</h2>
  Information about Regular Expressions.
  <h3>This is not a valid HTML</h4>
</body>

我使用了(?<=<[hH]([1-6])>).*?(?=<\/[hH]\1>) at regex101.com,但是它也可以计算标记<H1><h2>中的数字12
怎么解决呢?

afdcj2ne

afdcj2ne1#

它还匹配标签<H1><h2>中的数字12
不完全是。匹配本身只捕获内容。数字来自你的lookbehind中的捕获组。你可以忽略它。

相关问题