PHP正则表达式 /i, /is, /s, /isU等 都是些什么东西呢?



1、正则表达式运算顺序

( ) 圆括号因为是内存处理所以最高

* ? + { } 重复匹配内容其次

^ $ \b 边界处理第三

条件处理第四

最后按照运算顺序计算匹配

2、正则表达式模式修正符

i 正则内容在匹配时候不区分大小写(默认是区分的)

m 在匹配首内容或者尾内容时候采用多行识别匹配

S 将转义回车取消是为单行匹配如. 匹配的时候

x 忽略正则中的空白

A 强制从头开始匹配

D 强制$匹配尾部无任何内容 \n

U 禁止贪婪匹配只跟踪到最近的一个匹配符并结束,

常用在采集程序上的正则表达式

i 匹配大小写



s 模式中的圆点元字符(.)匹配所有的字符,包括换行符



x 模式中的空白字符除了被转义的或在字符类中的以外完全被忽略,在未转义的字符类之外的 # 以及下一个换行符之间的所有字符,包括两头,也都被忽略



A (PCRE_ANCHORED) 如果设定了此修正符,模式被强制为“anchored”,即强制仅从目标字符串的开头开始匹配即自动在模式开头加上^。



D (PCRE_DOLLAR_ENDONLY) 如果设定了此修正符,模式中的美元元字符仅匹配目标字符串的结尾。没有此选项时,如果最后一个字符是换行符的话,美元符号也会匹配此字符之前(但不会匹配任何其它换行符之前)。如果设定了 m 修正符则忽略此选项。Perl 中没有与其等价的修正符。 S 当一个模式将被使用若干次时,为加速匹配起见值得先对其进行分析。如果设定了此修正符则会进行额外的分析。目前,分析一个模式仅对没有单一固定起始字符的 non-anchored 模式有用。



U (PCRE_UNGREEDY) 本修正符反转了匹配数量的值使其不是默认的重复,而变成在后面跟上“?”才变得重复。这和 Perl 不兼容。也可以通过在模式之中设定 (?U) 修正符来启用此选项。



X (PCRE_EXTRA) 此修正符启用了一个 PCRE 中与 Perl 不兼容的额外功能。模式中的任何反斜线后面跟上一个没有特殊意义的字母导致一个错误,从而保留此组合以备将 来扩充。默认情况下,和 Perl 一样,一个反斜线后面跟一个没有特殊意义的字母被当成该字母本身。当前没有其它特性受此修正符控制。即:贪婪模式,最 大限度匹配如:/a[\w]+?e/U匹配abceadeddd中的abceade而不是abce,如果不加U修正,则匹配abce u (PCRE_UTF8) 此修正符启用了一个 PCRE 中与 Perl 不兼容的额外功能。模式字符串被当成 UTF-8。本修正符在 Unix 下自 PHP 4.1.0 起可用,在 win32 下自 PHP 4.2.3 起可用。



<?php



echo '<pre>';



$str = '<ul>hello world<li>hi</li><li>hello</li></ul>';



$pattern = '~<li>.*</li>~';



preg_match($pattern,$str,$matches);



var_dump($matches);







$pattern1 = '~<li>.*?</li>~';



preg_match($pattern1,$str,$matches1);



var_dump($matches1);







$pattern2 = '~<li>.*</li>~U';



preg_match($pattern2,$str,$matches2);



var_dump($matches2);







$pattern3 = '~<li>.*?</li>~U';



preg_match($pattern3,$str,$matches3);



var_dump($matches3);







事实证明,加了U,原来是贪婪匹配的变成非贪婪匹配,非贪婪匹配的却变成了贪婪匹配。