今天在使用js的test函数进行正则匹配时,发生了一个奇怪的问题,程序的运行结果显示总有一些字符串无法被匹配,即使它们“长得”和那些成功匹配的字符串非常相似。这些字符串示例如下:'%(ALLUSERSPROFILE)%'、'%(HOMEDRIVE)%'、'%(CommonProgramFiles)%'、'%(ProgramData)%'...等,指定的正则表达式为/%\(|\)%/g。

 

如上面所示的字符串,前三个都可以被成功匹配,而第四个就无法匹配成功了。最开始以为是字符串中包含非法字符或编码问题,于是将第四个字符串放到第一个,结果却显示匹配成功。

 

无意中将正则中的全局标志'g'删除,结果显示之前匹配不成功的字符串也被成功匹配了。很明显,问题的所在之处就是这个全局标志'g'。

 

后经查阅资料得知,如果为正则指定了全局标志,那么正则匹配会在全局模式下进行。全局模式下会有一个名为“lastIndex”的属性,该属性可能会对后续的匹配操作产生影响。因为其值的含义是上一次匹配成功时,匹配位置之后下一个字符的位置。如果没有匹配成功,该值被赋予0。该值的默认值也是0,故第一次匹配总是从字符串的[0]下标处开始进行。

 

结合实例分析下:第一个字符串为'%(ALLUSERSPROFILE)%',由于符合的匹配项“%(”位于[0]、[1]下标处,匹配成功之后,lastIndex值为2,故第二个字符串进行匹配时是从[2]处开始的。第二个字符串'%(HOMEDRIVE)%'的匹配项是“%)”,位于[11]、[12]处,故第三个字符串从[13]处开始,即lastIndex值为13。第三个字符串'%(CommonProgramFiles)%'的匹配项为“%)”,位于[20]、[21],故第四个字符串要从[22]处开始。而第四个字符串全长度也不够22,所以...匹配失败。附图一张,可以看到每次匹配之前和之后lastIndex的变化。其中每行第一个数字代表第几个字符串,第二个数字代表lastIndex值。

 

VirtualHardwares 全局模式失败_正则匹配

明白了问题的原因,解决方法也显而易见了,将正则中的全局标志'g'去掉即可。