一、JavaScript正则相关方法

str.match(regexp)与regexp.exec(str)功能类似。

str.search(regexp)与regexp.test(str)功能类似。

1. String.prototype.match()

检索匹配项,并返回匹配的第一个完整子串及其下捕获组捕获结果构成的数组(无g),或返回匹配的所有的完整子串(有g)

语法
str.match(regexp)
param:
  • regexp: 一个正则表达式对象。如果传入一个非正则表达式对象,则会隐式地使用 new RegExp(obj) 将其转换为一个 RegExp 。
return:
  • 如果正则表达式不包含g标志:会返回一个数组,数组的第一项是进行匹配完整的字符串,之后的项是用圆括号捕获的结果;数组还会包含一个 index属性,其值为匹配结果中的完整字符串在原字符串中的索引;数组还会包含一个 input属性, 其值为原字符串。此时返回的结果和 regexp.exec()返回的结果是完全相同的。
  • 如果正则表达式包含g标志:会返回一个数组,包含所有匹配的完整子字符串,但不包含匹配的捕获组捕获结果;也没有index属性和Input属性。
  • 如果提供了正则表达式,但是没有匹配到(无论是否带g): 返回null
  • 如果未提供任何参数,直接使用 match(): 返回一个包含空字符串的 Array :[""],同时该Array还包含index属性为0,input属性为原字符串 。
示例1: 正则表达式不带g, 带有捕获组, 且只有一个完整匹配
var str = 'For more information, see Chapter 3.4.5.1';
var reg = /see (chapter \d+(\.\d)*)/i;

var result = str.match(reg);

/* result:
[ 
  "see Chapter 3.4.5.1", 
  "Chapter 3.4.5.1", 
  ".1", 
  index: 22, 
  input: "For more information, see Chapter 3.4.5.1", groups: undefined
]
*/

// 'see Chapter 3.4.5.1' 是整个匹配。
// 'Chapter 3.4.5.1' 被'(chapter \d+(\.\d)*)'捕获。
// '.1' 是被'(\.\d)'捕获的最后一个值。
// 'index' 属性(22) 是整个匹配从零开始的索引。
// 'input' 属性是被解析的原始字符串。
示例2:正则表达式带g, 带有捕获组, 且只有一个完整匹配
var str = 'For more information, see Chapter 3.4.5.1';
var reg = /see (chapter \d+(\.\d)*)/ig;

var result = str.match(reg);

/* result:

[
  "see Chapter 3.4.5.1"
]
*/
示例3:正则表达式带g, 不带捕获组,有多个完整匹配
var str = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz';
var regexp = /[A-E]/gi;
var result = str.match(regexp);

/* result:
["A", "B", "C", "D", "E", "a", "b", "c", "d", "e"]
*/
示例4:正则表达式带g, 带有捕获组,有多个完整匹配
var str = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz';
var regexp = /A(BCD)*/gi;
var result = str.match(regexp);

/* result:
["ABCD", "abcd"]
*/
示例5: 不传参数
var str = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz';

var result = str.match();

/* result:
[
  "", 
  index: 0, 
  input: "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz", 
  groups: undefined
  ]
*/

2. RegExp.prototype.exec()

在一个指定字符串中执行一个搜索匹配。返回一个结果数组或 null。并会更新正则表达式对象的属性。

语法
regExp.exec(str)
param
  • str:要匹配正则表达式的字符串
return
  • 如果匹配成功:会返回一个数组,数组的第一项是进行匹配完整的字符串,之后的项是用圆括号捕获的结果;数组还会包含一个 index属性,其值为匹配结果中的完整字符串在原字符串中的索引;数组还会包含一个 input属性, 其值为原字符串。
  • 如果匹配失败:exec() 方法返回 null。

返回的结果和 str.match(regexp) 中regexp不带有g时的返回的结果是完全相同的。

对正则表达式对象属性的更新

对原正则表达式对象做了以下属性的更新:

  • lastIndex: 下一次匹配开始的位置。就是匹配的完整字符串之后的下一个字符的索引。当正则对象含有 "g" 时,可以在同一个正则对象上多次执行 exec 方法来查找同一个字符串中的多个成功匹配。查找将从正则表达式的 lastIndex 属性指定的位置开始。
  • ignoreCase: 是否使用了 "i" 标记使正则匹配忽略大小写
  • global:是否使用了 "g" 标记来进行全局的匹配.
  • multiline:
    是否使用了 "m" 标记使正则工作在多行模式(也就是,^ 和 $ 可以匹配字符串中每一行的开始和结束(行是由 \n 或 \r 分割的),而不只是整个输入字符串的最开始和最末尾处。)
  • source:正则表达式的字符串(不含igm标记)
示例1
var regexp = /quick\s(brown).+?(jumps)/ig;
var str = 'The Quick Brown Fox Jumps Over The Lazy Dog, quick brown jumps';
var result1 = regexp.exec(str);

/* result1:
[
  "Quick Brown Fox Jumps", 
  "Brown", 
  "Jumps", 
  index: 4, 
  input: "The Quick Brown Fox Jumps Over The Lazy Dog, quick brown jumps", 
  groups: undefined
]
*/

// regexp:
regexp.lastIndex;//25 (即Jumps后面的那个空格符)
regexp.ignoreCase;//true
regexp.global;//true
regexp.multiline;//false
regexp.source;//"quick\s(brown).+?(jumps)"


var result2 = regex.exec(str);

//result2:
/*
 [
  "quick brown jumps", 
  "brown", 
  "jumps", 
  index: 45, 
  input: "The Quick Brown Fox Jumps Over The Lazy Dog, quick brown jumps", 
  groups: undefined
]
*/

//regexp:
regexp.lastIndex;//62
regexp.ignoreCase;//true
regexp.global;//true
regexp.multiline;//false
regexp.source;//"quick\s(brown).+?(jumps)"

3. String.prototype.search()

执行正则表达式和字符串之间的一个搜索匹配。返回字符串中首次完整匹配的索引或-1。

语法
str.search(regexp)
param
  • regexp: 一个正则表达式对象。如果传入一个非正则表达式对象,则会使用 new RegExp(obj) 隐式地将其转换为正则表达式对象。
return
  • 如果匹配成功:返回正则表达式在字符串中首次完整匹配的索引。
  • 如果匹配失败:返回 -1。
示例1:
var str = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz';
var regexp = /A(BCD)*/gi;
str.search(regexp); //0

4. RegExp.prototype.test()

执行一个检索,用来查看正则表达式与指定的字符串是否匹配。返回 true 或 false。

语法
regexp.test(str)
param
  • str: 用来与正则表达式匹配的字符串
return

Type Boolean.如果正则表达式与指定的字符串匹配 ,返回true;否则false。

5. String.prototype.replace

返回一个由替换值替换一些或所有匹配的模式后的新字符串。模式可以是一个字符串或者一个正则表达式, 替换值可以是一个字符串或者一个每次匹配都要调用的函数。原字符串不改变

语法
str.replace(regexp|substr, newSubStr|function)
params
  • pattern:
  • regexp: 一个RegExp对象或者RegExp字面量。该正则所匹配的内容会被第二个参数的返回值替换掉。
  • substr: 一个字符串。其会被第二个参数的返回值替换掉,由于该substr是被视为一个字符串而非正则,所以仅仅是第一个匹配会被替换。
  • replacement:
  • newSubStr: 用于替换掉第一个参数在原字符串中的匹配部分的字符串。该字符串中可以内插一些特殊的变量名。
  • function: 一个用来创建新子字符串的函数,该函数的返回值将替换掉第一个参数匹配到的结果。

newSubStr中可以插入的特殊变量名:

变量名

代表值

$$

'$'

$&

匹配的子串

$`

当前匹配的子串左边的内容

$'

当前匹配的子串右边的内容

$n

n为正整数,如果replace()方法的第一个参数是regexp,则表示第n个捕获组的匹配结果

function的参数:

变量名

代表值

match

匹配的子串。(对应于上述的$&。)

p1,p2, ..

如果replace()方法的第一个参数是一个RegExp,则代表第n个捕获组的匹配结果。(对应于上述的$1,$2等。)

offset

匹配到的子字符串在原字符串中的偏移量。(比如,如果原字符串是“abcd”,匹配到的子字符串是“bc”,那么这个参数将是1)

string

被匹配的原字符串。

return

匹配替换后的新字符串。原字符串不变。

示例1:使用function替换正则匹配结果
function replaceFunc(match, p1, p2, p3, offset, string) {
  return [p1, p2, p3].join('-');
}

var str = 'abc12345#$*%';
var result = str.replace(/([^\d]*)(\d*)([^\w]*)/, replaceFunc)//"abc-12345-#$*%"
示例2: 替换带有g标志的正则
var str = 'Apples are round, and apples are juicy.'; 
var result = str.replace(/apples/ig, 'oranges');//'oranges are round, and oranges are juicy'.
示例3: 重组字符串中的多个子串
var str = 'John Smith';
var result = str.replace(/(\w+)\s(\w+)/,'$2 and $1');//'Smith and John'
示例4: 将华氏温度转换为对应摄氏温度
function f2c(x)
{
  function convert(str, p1, offset, s)
  {
    return ((p1-32) * 5/9) + "C";
  }
  var s = String(x);
  var test = /(\d+(?:\.\d*)?)F\b/g;
  return s.replace(test, convert);
}
示例5: 字符串去前后空格 经典!& 常用!
str.replace(/^\s+|\s+$/g, "");

二、常用匹配字符

1.字符类别

字符

含义

.

匹配任意单个字符,除了\n \r \u2028或\u2029

\d

匹配任意阿拉伯数字。等价于[0-9]

\D

匹配任意不是阿拉伯数字的字符。等价于[^0-9]

\w

匹配任意数字字母下划线。等价于[A-Za-z0-9_]

\W

匹配任意不是数字字母下划线的字符。等价于[^A-Za-z0-9]

\s

匹配一个空白符,包括空格、制表符、换页符、换行符、回车符合其他Unicode空格。等价于[ \t\f\n\r\v\u00a0等等]

\S

匹配一个非空白符

\t

匹配一个水平制表符(tab)

\r

匹配一个回车符(carriage return)

\n

匹配一个换行符(linefeed)

\v

匹配一个垂直制表符(vertical tab)

\f

匹配一个换页符(form-feed)

[\b]

匹配一个退格符(backspace)(不要与 \b 混淆)

2. 边界

字符

含义

^

匹配输入开始。当有m标志时,将开始和结束字符(^和$)视为在多行上工作(也就是,分别匹配每一行的开始和结束(由 \n 或 \r 分割),而不只是只匹配整个输入字符串的最开始和最末尾处

$

匹配输入结尾。 当有m标志时,将开始和结束字符(^和$)视为在多行上工作(也就是,分别匹配每一行的开始和结束(由 \n 或 \r 分割),而不只是只匹配整个输入字符串的最开始和最末尾处

\b

匹配一个零宽单词边界,如一个字母和一个空格之间。(不要和 [\b] 混淆)。例如,/\bno/ 匹配 "at noon" 中的 "no",/ly\b/ 匹配 "possibly yesterday." 中的 "ly"。

\B

匹配一个零宽非单词边界,如两个字母之间或两个空格之间。例如, /\Bon/匹配'at noon'中的'on, /ye\B/匹配'possibly yesterday'中的ye。

3. 断言

字符

含义

x(?=y)

仅匹配被y跟随的x。y可以是任意的正则字符组合。

x(?!y)

仅匹配不被y跟随的x。y可以是任意的正则字符组合。例如,举个例子,/\d+(?!.)/ 只会匹配不被点(.)跟随的数字。

三. 验证常用正则表达式

1. 邮箱

简化版:

/\S+@\S+\.\S+/

复杂版:

/^([A-Za-z0-9_\-\.])+\@([A-Za-z0-9_\-\.])+\.([A-Za-z]{2,4})$/

2. 用户名

用户名正则,4到16位(字母,数字,下划线,减号)

/^[a-zA-Z0-9_-]{4,16}$/

3. 满足一定强度的密码

最少6位,至少包括1个大写字母、1个小写字母、1个数字、1个特殊字符:

/^.*(?=.{6,})(?=.*\d)(?=.*[A-Z])(?=.*[a-z])(?=.*[!@#$%^&*? ]).*$/

检查某密码是否满足该强度:

var pattern=/^.*(?=.{6,})(?=.*\d)(?=.*[A-Z])(?=.*[a-z])(?=.*[!@#$%^&*? ]).*$/;
pattern.test('Ftc0615!#%^')//true

4. 手机号码正则

/^((13[0-9])|(14[5|7])|(15([0-3]|[5-9]))|(18[0,5-9]))\d{8}$/

5. 身份证号正则

/^[1-9]\d{5}(18|19|([23]\d))\d{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)\d{3}[0-9Xx]$/

四、分组与捕获括号

括号分为 捕获分组括号,和 仅用于分组的非捕获型括号两种。

1.捕获/分组括号:(...)

普通的无特殊意义的括号通常有两种功能:分组和捕获。

捕获型括号的编号是按照 开括号的次序,从左到右计算的。

如果提供了反向引用,则这些括号内的子表达式匹配的文本可以在表达式的后面部分使用$1、$2来引用。

2.仅用于分组的括号/非捕获型括号:(?:...)

仅用于分组的括号不能用来提取文本,而只能用来规定多选结构或者量词的作用对象。

它们不会按照$1、$2编号。

Example:

(1|one)(?:and|or)(2|two)

这样匹配之后,$1包含'1'或'one',$2包含'2'或'two'