一、JavaScript正则相关方法
str.match(regexp)与regexp.exec(str)功能类似。
str.search(regexp)与regexp.test(str)功能类似。
1. String.prototype.match()
检索匹配项,并返回匹配的第一个完整子串及其下捕获组捕获结果构成的数组(无g),或返回匹配的所有的完整子串(有g)
语法
str.match(regexp)
param:
- regexp: 一个正则表达式对象。如果传入一个非正则表达式对象,则会隐式地使用 new RegExp(obj) 将其转换为一个 RegExp 。
return:
- 如果正则表达式不包含g标志:会返回一个数组,数组的第一项是进行匹配完整的字符串,之后的项是用圆括号捕获的结果;数组还会包含一个 index属性,其值为匹配结果中的完整字符串在原字符串中的索引;数组还会包含一个 input属性, 其值为原字符串。此时返回的结果和 regexp.exec()返回的结果是完全相同的。
- 如果正则表达式包含g标志:会返回一个数组,包含所有匹配的完整子字符串,但不包含匹配的捕获组捕获结果;也没有index属性和Input属性。
- 如果提供了正则表达式,但是没有匹配到(无论是否带g): 返回null
- 如果未提供任何参数,直接使用 match(): 返回一个包含空字符串的 Array :[""],同时该Array还包含index属性为0,input属性为原字符串 。
示例1: 正则表达式不带g, 带有捕获组, 且只有一个完整匹配
var str = 'For more information, see Chapter 3.4.5.1';
var reg = /see (chapter \d+(\.\d)*)/i;
var result = str.match(reg);
/* result:
[
"see Chapter 3.4.5.1",
"Chapter 3.4.5.1",
".1",
index: 22,
input: "For more information, see Chapter 3.4.5.1", groups: undefined
]
*/
// 'see Chapter 3.4.5.1' 是整个匹配。
// 'Chapter 3.4.5.1' 被'(chapter \d+(\.\d)*)'捕获。
// '.1' 是被'(\.\d)'捕获的最后一个值。
// 'index' 属性(22) 是整个匹配从零开始的索引。
// 'input' 属性是被解析的原始字符串。
示例2:正则表达式带g, 带有捕获组, 且只有一个完整匹配
var str = 'For more information, see Chapter 3.4.5.1';
var reg = /see (chapter \d+(\.\d)*)/ig;
var result = str.match(reg);
/* result:
[
"see Chapter 3.4.5.1"
]
*/
示例3:正则表达式带g, 不带捕获组,有多个完整匹配
var str = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz';
var regexp = /[A-E]/gi;
var result = str.match(regexp);
/* result:
["A", "B", "C", "D", "E", "a", "b", "c", "d", "e"]
*/
示例4:正则表达式带g, 带有捕获组,有多个完整匹配
var str = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz';
var regexp = /A(BCD)*/gi;
var result = str.match(regexp);
/* result:
["ABCD", "abcd"]
*/
示例5: 不传参数
var str = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz';
var result = str.match();
/* result:
[
"",
index: 0,
input: "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz",
groups: undefined
]
*/
2. RegExp.prototype.exec()
在一个指定字符串中执行一个搜索匹配。返回一个结果数组或 null。并会更新正则表达式对象的属性。
语法
regExp.exec(str)
param
- str:要匹配正则表达式的字符串
return
- 如果匹配成功:会返回一个数组,数组的第一项是进行匹配完整的字符串,之后的项是用圆括号捕获的结果;数组还会包含一个 index属性,其值为匹配结果中的完整字符串在原字符串中的索引;数组还会包含一个 input属性, 其值为原字符串。
- 如果匹配失败:exec() 方法返回 null。
返回的结果和 str.match(regexp) 中regexp不带有g时的返回的结果是完全相同的。
对正则表达式对象属性的更新
对原正则表达式对象做了以下属性的更新:
- lastIndex: 下一次匹配开始的位置。就是匹配的完整字符串之后的下一个字符的索引。当正则对象含有 "g" 时,可以在同一个正则对象上多次执行 exec 方法来查找同一个字符串中的多个成功匹配。查找将从正则表达式的 lastIndex 属性指定的位置开始。
- ignoreCase: 是否使用了 "i" 标记使正则匹配忽略大小写
- global:是否使用了 "g" 标记来进行全局的匹配.
- multiline:
是否使用了 "m" 标记使正则工作在多行模式(也就是,^ 和 $ 可以匹配字符串中每一行的开始和结束(行是由 \n 或 \r 分割的),而不只是整个输入字符串的最开始和最末尾处。) - source:正则表达式的字符串(不含igm标记)
示例1
var regexp = /quick\s(brown).+?(jumps)/ig;
var str = 'The Quick Brown Fox Jumps Over The Lazy Dog, quick brown jumps';
var result1 = regexp.exec(str);
/* result1:
[
"Quick Brown Fox Jumps",
"Brown",
"Jumps",
index: 4,
input: "The Quick Brown Fox Jumps Over The Lazy Dog, quick brown jumps",
groups: undefined
]
*/
// regexp:
regexp.lastIndex;//25 (即Jumps后面的那个空格符)
regexp.ignoreCase;//true
regexp.global;//true
regexp.multiline;//false
regexp.source;//"quick\s(brown).+?(jumps)"
var result2 = regex.exec(str);
//result2:
/*
[
"quick brown jumps",
"brown",
"jumps",
index: 45,
input: "The Quick Brown Fox Jumps Over The Lazy Dog, quick brown jumps",
groups: undefined
]
*/
//regexp:
regexp.lastIndex;//62
regexp.ignoreCase;//true
regexp.global;//true
regexp.multiline;//false
regexp.source;//"quick\s(brown).+?(jumps)"
3. String.prototype.search()
执行正则表达式和字符串之间的一个搜索匹配。返回字符串中首次完整匹配的索引或-1。
语法
str.search(regexp)
param
- regexp: 一个正则表达式对象。如果传入一个非正则表达式对象,则会使用 new RegExp(obj) 隐式地将其转换为正则表达式对象。
return
- 如果匹配成功:返回正则表达式在字符串中首次完整匹配的索引。
- 如果匹配失败:返回 -1。
示例1:
var str = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz';
var regexp = /A(BCD)*/gi;
str.search(regexp); //0
4. RegExp.prototype.test()
执行一个检索,用来查看正则表达式与指定的字符串是否匹配。返回 true 或 false。
语法
regexp.test(str)
param
- str: 用来与正则表达式匹配的字符串
return
Type Boolean.如果正则表达式与指定的字符串匹配 ,返回true;否则false。
5. String.prototype.replace
返回一个由替换值替换一些或所有匹配的模式后的新字符串。模式可以是一个字符串或者一个正则表达式, 替换值可以是一个字符串或者一个每次匹配都要调用的函数。原字符串不改变
语法
str.replace(regexp|substr, newSubStr|function)
params
- pattern:
- regexp: 一个RegExp对象或者RegExp字面量。该正则所匹配的内容会被第二个参数的返回值替换掉。
- substr: 一个字符串。其会被第二个参数的返回值替换掉,由于该substr是被视为一个字符串而非正则,所以仅仅是第一个匹配会被替换。
- replacement:
- newSubStr: 用于替换掉第一个参数在原字符串中的匹配部分的字符串。该字符串中可以内插一些特殊的变量名。
- function: 一个用来创建新子字符串的函数,该函数的返回值将替换掉第一个参数匹配到的结果。
newSubStr中可以插入的特殊变量名:
变量名 | 代表值 |
$$ | '$' |
$& | 匹配的子串 |
$` | 当前匹配的子串左边的内容 |
$' | 当前匹配的子串右边的内容 |
$n | n为正整数,如果replace()方法的第一个参数是regexp,则表示第n个捕获组的匹配结果 |
function的参数:
变量名 | 代表值 |
match | 匹配的子串。(对应于上述的$&。) |
p1,p2, .. | 如果replace()方法的第一个参数是一个RegExp,则代表第n个捕获组的匹配结果。(对应于上述的$1,$2等。) |
offset | 匹配到的子字符串在原字符串中的偏移量。(比如,如果原字符串是“abcd”,匹配到的子字符串是“bc”,那么这个参数将是1) |
string | 被匹配的原字符串。 |
return
匹配替换后的新字符串。原字符串不变。
示例1:使用function替换正则匹配结果
function replaceFunc(match, p1, p2, p3, offset, string) {
return [p1, p2, p3].join('-');
}
var str = 'abc12345#$*%';
var result = str.replace(/([^\d]*)(\d*)([^\w]*)/, replaceFunc)//"abc-12345-#$*%"
示例2: 替换带有g标志的正则
var str = 'Apples are round, and apples are juicy.';
var result = str.replace(/apples/ig, 'oranges');//'oranges are round, and oranges are juicy'.
示例3: 重组字符串中的多个子串
var str = 'John Smith';
var result = str.replace(/(\w+)\s(\w+)/,'$2 and $1');//'Smith and John'
示例4: 将华氏温度转换为对应摄氏温度
function f2c(x)
{
function convert(str, p1, offset, s)
{
return ((p1-32) * 5/9) + "C";
}
var s = String(x);
var test = /(\d+(?:\.\d*)?)F\b/g;
return s.replace(test, convert);
}
示例5: 字符串去前后空格 经典!& 常用!
str.replace(/^\s+|\s+$/g, "");
二、常用匹配字符
1.字符类别
字符 | 含义 |
. | 匹配任意单个字符,除了\n \r \u2028或\u2029 |
\d | 匹配任意阿拉伯数字。等价于[0-9] |
\D | 匹配任意不是阿拉伯数字的字符。等价于[^0-9] |
\w | 匹配任意数字字母下划线。等价于[A-Za-z0-9_] |
\W | 匹配任意不是数字字母下划线的字符。等价于[^A-Za-z0-9] |
\s | 匹配一个空白符,包括空格、制表符、换页符、换行符、回车符合其他Unicode空格。等价于[ \t\f\n\r\v\u00a0等等] |
\S | 匹配一个非空白符 |
\t | 匹配一个水平制表符(tab) |
\r | 匹配一个回车符(carriage return) |
\n | 匹配一个换行符(linefeed) |
\v | 匹配一个垂直制表符(vertical tab) |
\f | 匹配一个换页符(form-feed) |
[\b] | 匹配一个退格符(backspace)(不要与 \b 混淆) |
2. 边界
字符 | 含义 |
^ | 匹配输入开始。当有m标志时,将开始和结束字符(^和$)视为在多行上工作(也就是,分别匹配每一行的开始和结束(由 \n 或 \r 分割),而不只是只匹配整个输入字符串的最开始和最末尾处 |
$ | 匹配输入结尾。 当有m标志时,将开始和结束字符(^和$)视为在多行上工作(也就是,分别匹配每一行的开始和结束(由 \n 或 \r 分割),而不只是只匹配整个输入字符串的最开始和最末尾处 |
\b | 匹配一个零宽单词边界,如一个字母和一个空格之间。(不要和 [\b] 混淆)。例如,/\bno/ 匹配 "at noon" 中的 "no",/ly\b/ 匹配 "possibly yesterday." 中的 "ly"。 |
\B | 匹配一个零宽非单词边界,如两个字母之间或两个空格之间。例如, /\Bon/匹配'at noon'中的'on, /ye\B/匹配'possibly yesterday'中的ye。 |
3. 断言
字符 | 含义 |
x(?=y) | 仅匹配被y跟随的x。y可以是任意的正则字符组合。 |
x(?!y) | 仅匹配不被y跟随的x。y可以是任意的正则字符组合。例如,举个例子,/\d+(?!.)/ 只会匹配不被点(.)跟随的数字。 |
三. 验证常用正则表达式
1. 邮箱
简化版:
/\S+@\S+\.\S+/
复杂版:
/^([A-Za-z0-9_\-\.])+\@([A-Za-z0-9_\-\.])+\.([A-Za-z]{2,4})$/
2. 用户名
用户名正则,4到16位(字母,数字,下划线,减号)
/^[a-zA-Z0-9_-]{4,16}$/
3. 满足一定强度的密码
最少6位,至少包括1个大写字母、1个小写字母、1个数字、1个特殊字符:
/^.*(?=.{6,})(?=.*\d)(?=.*[A-Z])(?=.*[a-z])(?=.*[!@#$%^&*? ]).*$/
检查某密码是否满足该强度:
var pattern=/^.*(?=.{6,})(?=.*\d)(?=.*[A-Z])(?=.*[a-z])(?=.*[!@#$%^&*? ]).*$/;
pattern.test('Ftc0615!#%^')//true
4. 手机号码正则
/^((13[0-9])|(14[5|7])|(15([0-3]|[5-9]))|(18[0,5-9]))\d{8}$/
5. 身份证号正则
/^[1-9]\d{5}(18|19|([23]\d))\d{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)\d{3}[0-9Xx]$/
四、分组与捕获括号
括号分为 捕获分组括号,和 仅用于分组的非捕获型括号两种。
1.捕获/分组括号:(...)
普通的无特殊意义的括号通常有两种功能:分组和捕获。
捕获型括号的编号是按照 开括号的次序,从左到右计算的。
如果提供了反向引用,则这些括号内的子表达式匹配的文本可以在表达式的后面部分使用$1、$2来引用。
2.仅用于分组的括号/非捕获型括号:(?:...)
仅用于分组的括号不能用来提取文本,而只能用来规定多选结构或者量词的作用对象。
它们不会按照$1、$2编号。
Example:
(1|one)(?:and|or)(2|two)
这样匹配之后,$1包含'1'或'one',$2包含'2'或'two'