一,定义:符合一点规则的表达式
二,特点:用一些特定的符号来表示一些代码操作,简化书写
三,作用及优缺点:
作用:用于专门操作字符串
优点:可以简化对字符串的复杂操作
缺点:符号定义越多,正则越长,阅读性极差
四,具体操作功能:
1. 匹配:String的matches方法
2. 切割:String的split方法
3. 替换:String的replace方法
获取:示例代码:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
* 正则表达式操作:获取
* @author 小苏
*
*/
public class Test8 {
public static void main(String[] args) {
String str = "csddddcdcgggcssdfdfvcsd";
String regex = "([a-z])\\1+";
Pattern pa = Pattern.compile(regex);
Matcher ma = pa.matcher(str);
while(ma.find()){
System.out.println(ma.group());
/**
* 结果:
* dddd
* ggg
* ss
*
* */
}
}
}
正则表达式的构造常用摘要
字符类 | |
[abc] | a、b 或 c(简单类) |
[^abc] | 任何字符,除了 a、b 或 c(否定) |
[a-zA-Z] | a 到 z 或 A 到 Z,两头的字母包括在内(范围) |
[a-d[m-p]] | a 到 d 或 m 到 p:[a-dm-p](并集) |
[a-z&&[def]] | d、e 或 f(交集) |
[a-z&&[^bc]] | a 到 z,除了 b 和 c:[ad-z](减去) |
[a-z&&[^m-p]] | a 到 z,而非 m 到 p:[a-lq-z](减去) |
预定义字符类 | |
. | 任何字符(与行结束符可能匹配也可能不匹配) |
\d | 数字:[0-9] |
\D | 非数字: [^0-9] |
\s | 空白字符:[ \t\n\x0B\f\r] |
\S | 非空白字符:[^\s] |
\w | 单词字符:[a-zA-Z_0-9] |
\W | 非单词字符:[^\w] |
Greedy 数量词 | |
X? | X,一次或一次也没有 |
X* | X,零次或多次 |
X+ | X,一次或多次 |
X{n} | X,恰好 n 次 |
X{n,} | X,至少 n 次 |
X{n,m} | X,至少 n 次,但是不超过 m 次 |
边界匹配器 | |
^ | 行的开头 |
$ | 行的结尾 |
\b | 单词边界 |
\B | 非单词边界 |
\A | 输入的开头 |
\G | 上一个匹配的结尾 |
\Z | 输入的结尾,仅用于最后的结束符(如果有的话) |
\z | 输入的结尾 |
逻辑运算符 | |
XY | X 后跟 Y |
X|Y | X 或 Y |
(X) | X,作为捕获组 |
六,组合捕获
捕获组可以通过从左到右计算其开括号来编号。例如,在表达式 ((A)(B(C))) 中,存在四个这样的组:
1 | ((A)(B(C))) |
2 | \A |
3 | (B(C)) |
4 | (C) |
七,Pattern和Matcher类(示例代码见四):
Pattern类常用方法:
compile(String regex) (获取Matcher对象实例)
将给定的正则表达式编译到模式中。
matches(String regex, CharSequence input)
编译给定正则表达式并尝试将给定输入与其匹配
Matcher类常用方法:
matches()
尝试将整个区域与模式匹配。
find()
尝试查找与该模式匹配的输入序列的下一个子序列。
group()
返回由以前匹配操作所匹配的输入子序列。
end()
返回最后匹配字符之后的偏移量。
start()
返回以前匹配的初始索引。