多重RegEx否定匹配

8ulbf1ek  于 2023-05-08  发布在  其他
关注(0)|答案(1)|浏览(93)

我有以下RegEx模式:

  1. "[0-9]{4,5}\.FU|[0-9]{4,5}\.NG|[0-9]{4,5}\.SP|[0-9]{4,5}\.T|JGB[A-Z][0-9]|JNI[A-Z][0-9]|JN4F[A-Z][0-9]|JNM[A-Z][0-9]|JTI[A-Z][0-9]|JTM[A-Z][0-9]|NIY[A-Z][0-9]|SSI[A-Z][0-9]|JNI[A-Z][0-9]-[A-Z][0-9]|JTI[A-Z][0-9]-[A-Z][0-9]" ===>匹配8411.T或JNID 8
  2. "[0-9]{4,5}\.HK|HSI[A-Z][0-9]|HMH[A-Z][0-9]|HCEI[A-Z][0-9]|HCEI[A-Z][0-9]-[A-Z][0-9]" ==>匹配9345.HK或HCEIU 9-A9
  3. ".*\.SI|SFC[A-Z][0-9]" ==>匹配8345.SI或SFCX 8
    我如何从这些模式的否定中获得RegEx?我想匹配不匹配这三种模式的字符串:例如,我想匹配8411.ABC,但不匹配任何上述字符串(8411.T、HCEIU-A9、8345.SI等)。
    我试过了(例如,只排除2和3,但它不起作用):
^(?!((.*\.SI|SFC[A-Z][0-9])|([0-9]{4,5}\.HK|HSI[A-Z][0-9]|HMH[A-Z][0-9]|HCEI[A-Z][0-9]|HCEI[A-Z][0-9]-[A-Z][0-9])))
gcuhipw9

gcuhipw91#

这里的主要思想是将模式放置到(?!.*<pattern>)负lookaheads中,锚定在字符串的开头(^)。这里的困难在于,你的模式包含了未锚定的替换,如果没有分组,模式之前的.*将只引用第一个替换(即所有随后的替换将仅在串的开始处被求反。
因此,模式公式为^(?!.*(?:<PATTERN1>))(?!.*(?:<PATTERN2>))(?!.*(?:<PATTERN3>))。请注意,如果您只需要得到一个布尔结果,那么最后的.+.*是可选的。请注意,在最后一个模式中,您需要删除第一个替代方案中的.*,使用.*.*没有意义。
使用

^(?!.*(?:[0-9]{4,5}\.FU|[0-9]{4,5}\.NG|[0-9]{4,5}\.SP|[0-9]{4,5}\.T|JGB[A-Z][0-9]|JNI[A-Z][0-9]|JN4F[A-Z][0-9]|JNM[A-Z][0-9]|JTI[A-Z][0-9]|JTM[A-Z][0-9]|NIY[A-Z][0-9]|SSI[A-Z][0-9]|JNI[A-Z][0-9]-[A-Z][0-9]|JTI[A-Z][0-9]-[A-Z][0-9]))(?!.*(?:[0-9]{4,5}\.HK|HSI[A-Z][0-9]|HMH[A-Z][0-9]|HCEI[A-Z][0-9]|HCEI[A-Z][0-9]-[A-Z][0-9]))(?!.*(?:\.SI|SFC[A-Z][0-9])).+

参见regex demo
您也可以将公式收缩为^(?!.*(?:<PATTERN1>|<PATTERN2>|<PATTERN3>))

^(?!.*(?:[0-9]{4,5}\.FU|[0-9]{4,5}\.NG|[0-9]{4,5}\.SP|[0-9]{4,5}\.T|JGB[A-Z][0-9]|JNI[A-Z][0-9]|JN4F[A-Z][0-9]|JNM[A-Z][0-9]|JTI[A-Z][0-9]|JTM[A-Z][0-9]|NIY[A-Z][0-9]|SSI[A-Z][0-9]|JNI[A-Z][0-9]-[A-Z][0-9]|JTI[A-Z][0-9]-[A-Z][0-9]|[0-9]{4,5}\.HK|HSI[A-Z][0-9]|HMH[A-Z][0-9]|HCEI[A-Z][0-9]|HCEI[A-Z][0-9]-[A-Z][0-9]|\.SI|SFC[A-Z][0-9])).+

参见another regex demo

相关问题