-
匹配字符串字面值
普通字符 -
匹配数字
\d
[0-9]
[0123456789] -
匹配非数字字符
\D
[^0-9]
[^\d]
\w -- [_a-zA-Z0-9]
\W -- [^_a-zA-Z0-9] -
匹配空白
\s
[\t\n\r]
\S
[^\t\n\r]
[^\s]
^
$
^The.*?$
\bTHE\b
-
捕获并分组
(The|the|THE)
(?i) 不区分大小写
(?i)the -
子模式
(t|T)h(e|eir) -
非捕获分组
(?:the|The)
4.1 贪心 懒惰 占有
-
贪心
量词默认是贪心的,首先匹配整个字符串,若失败则回退一个字符再尝试,这个操作称为 回溯。
他每次回溯一个字符,直到匹配或者没有字符。 -
懒惰
从起始位置开始。要使用懒惰,必须在量词后加问号 ? -
占有
先吞下整个内容,进行一次匹配,量词后加+
比如 .+0,无法匹配 00000,因为 首先 吞下所有内容,匹配 .,但是匹配0时,输入已经没有内容,导致失败