JS学习(三)之正则表达式的匹配
- 使用测试方法
如果你想要在字符串"The dog chased the cat"中匹配到"the"这个单词,你可以使用如下正则表达式:/the/。注意,正则表达式中不需要引号。
JavaScript 中有多种使用正则表达式的方法。测试正则表达式的一种方法是使用.test()方法。.test()方法会把你编写的正则表达式应用到一个字符串(即括号内的内容),如果你的匹配模式成功匹配到字符,则返回true,反之,返回false。
let testStr = "freeCodeCamp";
let testRegex = /Code/;
testRegex.test(testStr);
// Returns true
- 匹配文字字符串
正则表达式/Kevin/不会匹配"kevin"或者"KEVIN"。
let wrongRegex = /kevin/;
wrongRegex.test(testStr);
// Returns false
- 同时用多种模式匹配文字字符串
此操作符匹配在它之前或之后的匹配模式。例如,如果你想匹配"yes"或"no",你需要的正则表达式是/yes|no/。
你还可以匹配多个规则,这可以通过添加更多的匹配模式来实现。这些匹配模式将包含更多的|操作符来分隔它们,比如/yes|no|maybe/。 - 匹配时忽略大小写
可以通过将它附加到正则表达式之后来使用它。这里给出使用该标志的一个实例/ignorecase/i。这个字符串可以匹配字符串"ignorecase"、“igNoreCase"和"IgnoreCase”。 - 提取匹配项
请使用字符串来调用.match()方法,并在括号内传入正则表达式。以下是一个示例:
"Hello, World!".match(/Hello/);
// Returns ["Hello"]
let ourStr = "Regular expressions";
let ourRegex = /expressions/;
ourStr.match(ourRegex);
// Returns ["expressions"]
- 全局匹配
到目前为止,你只能提取或搜寻一次匹配模式。
let testStr = "Repeat, Repeat, Repeat";
let ourRegex = /Repeat/;
testStr.match(ourRegex);
// Returns ["Repeat"]
若要多次搜寻或提取匹配模式,你可以使用g标志。
let repeatRegex = /Repeat/g;
testStr.match(repeatRegex);
// Returns ["Repeat", "Repeat", "Repeat"]
- 用通配符.匹配任何内容
通配符.将匹配任何一个字符。通配符也叫dot或period。你可以像使用正则表达式中任何其他字符一样使用通配符。例如,如果你想匹配"hug"、“huh”、“hut"和"hum”,你可以使用正则表达式/hu./匹配以上四个单词。
let humStr = "I'll hum a song";
let hugStr = "Bear hug";
let huRegex = /hu./;
humStr.match(huRegex); // Returns ["hum"]
hugStr.match(huRegex); // Returns ["hug"]
- 将单个字符与多种可能性匹配
你想要匹配"bag"、“big"和"bug”,但是不想匹配"bog"。你可以创建正则表达式/b[aiu]g/来执行此操作。[aiu]是只匹配字符"a"、"i"或者"u"的字符集
let bigStr = "big";
let bagStr = "bag";
let bugStr = "bug";
let bogStr = "bog";
let bgRegex = /b[aiu]g/;
bigStr.match(bgRegex); // Returns ["big"]
bagStr.match(bgRegex); // Returns ["bag"]
bugStr.match(bgRegex); // Returns ["bug"]
bogStr.match(bgRegex); // Returns null
- 匹配字母表中的字母
在字符集中,你可以使用连字符(-)来定义要匹配的字符范围。
例如,要匹配小写字母a到e,你可以使用[a-e]。
let catStr = "cat";
let batStr = "bat";
let matStr = "mat";
let bgRegex = /[a-e]at/;
catStr.match(bgRegex); // Returns ["cat"]
batStr.match(bgRegex); // Returns ["bat"]
matStr.match(bgRegex); // Returns null
- 匹配字母表中的数字和字母
使用连字符(-)匹配字符范围并不仅限于字母。它还可以匹配一系列数字。
例如,/[0-5]/匹配0和5之间的任意数字,包含0和5。
此外,还可以在单个字符集中组合一系列字母和数字。
let jennyStr = "Jenny8675309";
let myRegex = /[a-z0-9]/ig;
// matches all letters and numbers in jennyStr
jennyStr.match(myRegex);
- 匹配单个未指定的字符
创建否定字符集,你需要在开始括号后面和不想匹配的字符前面放置插入字符(即^)。
例如,/[^aeiou]/gi匹配所有非元音字符。注意,字符.、!、[、@、/和空白字符等也会被匹配,该否定字符集仅排除元音字符。 - 匹配出现一次或多次的字符
使用+符号来检查情况是否如此。记住,字符或匹配模式必须一个接一个地连续出现。
例如,/a+/g会在"abc"中匹配到一个匹配项,并且返回[“a”]。因为+的存在,它也会在"aabc"中匹配到一个匹配项,然后返回[“aa”]。
如果它是检查字符串"abab",它将匹配到两个匹配项并且返回[“a”, “a”],因为a字符不连续,在它们之间有一个b字符。最后,因为在字符串"bcd"中没有"a",因此找不到匹配项。 - 匹配出现零次或多次的字符
执行该操作的字符叫做asterisk或star,即*。
let soccerWord = "gooooooooal!";
let gPhrase = "gut feeling";
let oPhrase = "over the moon";
let goRegex = /go*/;
soccerWord.match(goRegex); // Returns ["goooooooo"]
gPhrase.match(goRegex); // Returns ["g"]
oPhrase.match(goRegex); // Returns null
- 用惰性匹配来查找字符
在正则表达式中,贪婪匹配会匹配到符合正则表达式匹配模式的字符串的最长可能部分,并将其作为匹配项返回。另一种方案称为懒惰匹配,它会匹配到满足正则表达式的字符串的最小可能部分。
你可以将正则表达式/t[a-z]*i/应用于字符串"titanic"。这个正则表达式是一个以t开始,以i结束,并且中间有一些字母的匹配模式。
正则表达式默认是贪婪匹配,因此匹配返回为[“titani”]。它会匹配到适合该匹配模式的最大子字符串。
但是,你可以使用?字符来将其变成懒惰匹配。调整后的正则表达式/t[a-z]*?i/匹配字符串"titanic"返回[“ti”]。 - 匹配字符串的开头
在之前的挑战中,你使用字符集中的插入符号()来创建一个否定字符集,形如[thingsThatWillNotBeMatched]。在字符集之外,插入符号用于字符串的开头搜寻匹配模式。
let firstString = "Ricky is first and can be found.";
let firstRegex = /^Ricky/;
firstRegex.test(firstString);
// Returns true
let notFirst = "You can't find Ricky now.";
firstRegex.test(notFirst);
// Returns false
- 匹配字符串的末尾
let theEnding = "This is a never ending story";
let storyRegex = /story$/;
storyRegex.test(theEnding);
// Returns true
let noEnding = "Sometimes a story will have to end";
storyRegex.test(noEnding);
// Returns false
- 匹配所有的字母和数字
JavaScript 中与字母表匹配的最接近的字符类是\w,这个缩写等同于[A-Za-z0-9_]。它不仅可以匹配大小写字母和数字,注意,它还会匹配下划线字符(_)。
let longHand = /[A-Za-z0-9_]+/;
let shortHand = /\w+/;
let numbers = "42";
let varNames = "important_var";
longHand.test(numbers); // Returns true
shortHand.test(numbers); // Returns true
longHand.test(varNames); // Returns true
shortHand.test(varNames); // Returns true
- 匹配除了字母和数字的所有符号
使用\W搜寻和\w相反的匹配模式。注意,相反匹配模式使用大写字母。此缩写与[^A-Za-z0-9_]是一样的。
let shortHand = /\W/;
let numbers = "42%";
let sentence = "Coding!";
numbers.match(shortHand); // Returns ["%"]
sentence.match(shortHand); // Returns ["!"]
- 匹配所有数字
查找数字字符的缩写是\d,注意是小写的d。这等同于字符类[0-9],它查找 0 到 9 之间任意数字的单个字符。 - 匹配所有非数字
查找非数字字符的缩写是\D。这等同于字符串[^0-9],它查找不是 0 - 9 之间数字的单个字符。 - 限制可能的用户名
1) 用户名中的数字必须在最后,且数字可以有零个或多个。
2) 用户名字母可以是小写字母和大写字母。
3) 用户名长度必须至少为两个字符。两位用户名只能使用字母。
let username = "JackOfAllTrades";
let userCheck = /^[a-z][a-z]+\d*$/i; // 修改这一行
let result = userCheck.test(username);
- 匹配空白字符
你可以使用\s搜寻空格,其中s是小写。此匹配模式不仅匹配空格,还匹配回车符、制表符、换页符和换行符,你可以将其视为与[\r\t\f\n\v]类似。
let whiteSpace = "Whitespace. Whitespace everywhere!"
let spaceRegex = /\s/g;
whiteSpace.match(spaceRegex);
// Returns [" ", " "]
- 使用\S搜寻非空白字符,其中S是大写。
- 指定匹配的上限和下限
你可以使用数量说明符指定匹配模式的上下限。数量说明符与花括号({和})一起使用。你可以在花括号之间放两个数字,这两个数字代表匹配模式的上限和下限。
例如,要在字符串"ah"中匹配仅出现3到5次的字母a,你的正则表达式应为/a{3,5}h/。
let A4 = "aaaah";
let A2 = "aah";
let multipleA = /a{3,5}\sh/;//小写
multipleA.test(A4); // Returns true
multipleA.test(A2); // Returns false
- 只指定匹配的下限
要匹配至少出现3次字母a的字符串"hah",你的正则表达式应该是/ha{3,}h/。
let A4 = "haaaah";
let A2 = "haah";
let A100 = "h" + "a".repeat(100) + "h";
let multipleA = /ha{3,}h/;
multipleA.test(A4); // Returns true
multipleA.test(A2); // Returns false
multipleA.test(A100); // Returns true
- 指定匹配的确切数量
要只匹配字母a出现3次的单词"hah",你的正则表达式应为/ha{3}h/ - 检查全部或无
let american = "color";
let british = "colour";
let rainbowRegex= /colou?r/;
rainbowRegex.test(american); // Returns true
rainbowRegex.test(british); // Returns true
- 正向先行断言和负向先行断言
搜寻多个匹配模式时,这可能非常有用。
有两种先行断言:正向先行断言和负向先行断言。
正向先行断言会查看并确保搜索匹配模式中的元素存在,但实际上并不匹配。正向先行断言的用法是(?=…),其中…就是需要存在但不会被匹配的部分。
另一方面,负向先行断言会查看并确保搜索匹配模式中的元素不存在。负向先行断言的用法是(?!..),其中…是你希望不存在的匹配模式。如果负向先行断言部分不存在,将返回匹配模式的其余部分。
let quit = "qu";
let noquit = "qt";
let quRegex= /q(?=u)/;
let qRegex = /q(?!u)/;
quit.match(quRegex); // Returns ["q"]
noquit.match(qRegex); // Returns ["q"]
先行断言的更实际用途是检查一个字符串中的两个或更多匹配模式。这里有一个简单的密码检查器,密码规则是 3 到 6 个字符且至少包含一个数字:
let password = "abc123";
let checkPass = /(?=\w{3,6})(?=\D*\d)/;
checkPass.test(password); // Returns true
以匹配至少5个字符且有两个连续数字的密码。
let sampleWord = "astronaut";
let pwRegex = /(?=\w{6})(?=\w*\d{2})/;
let result = pwRegex.test(sampleWord);
- 使用捕获组重用模式
使用捕获组搜寻重复的子字符串。括号(和)可以用来匹配重复的子字符串。你只需要把重复匹配模式的正则表达式放在括号中即可。
要指定重复字符串将出现的位置,可以使用反斜杠(\)后接一个数字。这个数字从 1 开始,随着你使用的每个捕获组的增加而增加。
这里有一个示例,\1可以匹配第一个组。
下面的示例匹配任意两个被空格分割的单词:
let repeatStr = "regex regex";
let repeatRegex = /(\w+)\s\1/;
repeatRegex.test(repeatStr); // Returns true
repeatStr.match(repeatRegex); // Returns ["regex regex", "regex"]
在正则表达式reRegex中使用捕获组,以匹配在字符串中仅重复三次的数字,每一个都由空格分隔。
//??
let repeatNum = "42 42 42";
let reRegex = /^(\d+)\s\1\s\1$/; // 修改这一行
let result = reRegex.test(repeatNum);
- 使用捕获组搜索和替换
可以使用字符串上.replace()方法来搜索并替换字符串中的文本。
let wrongText = "The sky is silver.";
let silverRegex = /silver/;
wrongText.replace(silverRegex, "blue");
// Returns "The sky is blue."
还可以使用美元符号($)访问替换字符串中的捕获组。
"Code Camp".replace(/(\w+)\s(\w+)/, '$2 $1');
// Returns "Camp Code"
编写一个正则表达式,以搜索字符串"good"。然后更新变量replaceText,用字符串"okey-dokey"替换"good".
let huhText = "This sandwich is good.";
let fixRegex = /good/; // 修改这一行
let replaceText = "okey-dokey"; // 修改这一行
let result = huhText.replace(fixRegex, replaceText);
- 删除开头和结尾的空白
编写一个正则表达式并使用适当的字符串方法删除字符串开头和结尾的空格。
let hello = " Hello, World! ";
let wsRegex = /^\s+|\s+$/g;
let result = hello.replace(wsRegex,"");
//注意:
//.trim()方法在这里也可以实现同样的效果,