一,定义:符合一点规则的表达式

二,特点:用一些特定的符号来表示一些代码操作,简化书写

三,作用及优缺点:

作用:用于专门操作字符串

优点:可以简化对字符串的复杂操作

缺点:符号定义越多,正则越长,阅读性极差

四,具体操作功能:

1.      匹配:String的matches方法

2.      切割:String的split方法

3.      替换:String的replace方法

获取:示例代码:

import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
 * 正则表达式操作:获取
 * @author 小苏
 *
 */
public class Test8 {
	
	public static void main(String[] args) {
	
		String str = "csddddcdcgggcssdfdfvcsd";
		String regex = "([a-z])\\1+";
		Pattern pa = Pattern.compile(regex);
		Matcher ma = pa.matcher(str);
		
		while(ma.find()){
			System.out.println(ma.group());
			/**
			 * 结果:
			 * dddd
			 * ggg
			 * ss
			 * 
			 * */
		}
	}
}



正则表达式的构造常用摘要

        

字符类

[abc]

a、b 或 c(简单类)

[^abc]

任何字符,除了 a、b 或 c(否定)

[a-zA-Z]

a 到 z 或 A 到 Z,两头的字母包括在内(范围)

[a-d[m-p]]

a 到 d 或 m 到 p:[a-dm-p](并集)

[a-z&&[def]]

d、e 或 f(交集)

[a-z&&[^bc]]

a 到 z,除了 b 和 c:[ad-z](减去)

[a-z&&[^m-p]]

a 到 z,而非 m 到 p:[a-lq-z](减去)

预定义字符类

.

任何字符(与行结束符可能匹配也可能不匹配)

\d

数字:[0-9]

\D

非数字: [^0-9]

\s

空白字符:[ \t\n\x0B\f\r]

\S

非空白字符:[^\s]

\w

单词字符:[a-zA-Z_0-9]

\W

非单词字符:[^\w]

 

Greedy 数量词

X?

X,一次或一次也没有

X*

X,零次或多次

X+

X,一次或多次

X{n}

X,恰好 n

X{n,}

X,至少 n

X{n,m}

X,至少 n 次,但是不超过 m

  

边界匹配器

^

行的开头

$

行的结尾

\b

单词边界

\B

非单词边界

\A

输入的开头

\G

上一个匹配的结尾

\Z

输入的结尾,仅用于最后的结束符(如果有的话)

\z

输入的结尾

 

逻辑运算符

XY

X 后跟 Y

X|Y

XY

(X)

X,作为捕获组

六,组合捕获

捕获组可以通过从左到右计算其开括号来编号。例如,在表达式 ((A)(B(C))) 中,存在四个这样的组:


1    

((A)(B(C)))

2    

\A

3    

(B(C))

4    

(C)


七,Pattern和Matcher类(示例代码见四):

         Pattern类常用方法:

              compile(String regex) (获取Matcher对象实例)
                   将给定的正则表达式编译到模式中。

                   matches(String regex, CharSequence input)
                   编译给定正则表达式并尝试将给定输入与其匹配

Matcher类常用方法:

matches()
尝试将整个区域与模式匹配。

find()
尝试查找与该模式匹配的输入序列的下一个子序列。

group()
 返回由以前匹配操作所匹配的输入子序列。

end()
返回最后匹配字符之后的偏移量。


start()
返回以前匹配的初始索引。