本文的正则用Java代码表示
要看本篇博客首先你得会,别人给你个正则表达式你得熟练写出Java代码,这里有一篇Java正则的基础:
Java正则的基本用法
\b和\B的区别
\b和\B都是边界符。不同的是\b是单词分界符,而\B是非单词分界符。
这样也就注定了它们的匹配是不同的。
\b的用法
这里的\b,单词边界符能够匹配中文符号、英文符号、空格、制表符、回车符号,以及各种边界,比如单词在开头,单词在结尾。
这里要匹配的2也可以是中文。正则是可以处理中文的。
import java.util.regex.Pattern;
import java.util.regex.Matcher;
public class p3{
public static void main(String args[]){
String sta=",,,2,";
String regex="\\b2\\b";
Pattern pattern = Pattern.compile(regex);
Matcher matcher=pattern.matcher(sta);
while(matcher.find()){
System.out.println(true);
System.out.println(matcher.group());
}
}
}
运行结果:
true
2
\B的用法
\B是非单词分界符,即可以查出是否包含某个字,如“北斗狼神”中是否包含“狼”这个字。
import java.util.regex.Pattern;
import java.util.regex.Matcher;
public class p2{
public static void main(String args[]){
String sta="北斗狼神";
String regex="\\B狼\\B";
Pattern pattern = Pattern.compile(regex);
Matcher matcher=pattern.matcher(sta);
while(matcher.find()){
System.out.println(true);
System.out.println(matcher.group());
}
}
}
运行结果:
true
狼
上面就是\b和\B的基本用法。
\b和\B的注意事项
因为\b和\B是边界匹配符,所以一般不用来判断当前字符串是否符合某种规则,这样是不行的。
import java.util.regex.Pattern;
import java.util.regex.Matcher;
public class p1{
public static void main(String args[]){
String sta=" 1 ";
String regex="\\b1\\b";
System.out.println(sta.matches(regex));
}
}
运行结果:
false
刚开始我以为输出的是true,结果是false
所以\b和\B这种边界符一般用来获取,而不是用来判断、替换。
但是,我就想知道\b到底为什么不能够匹配上面这个例子呢???而不仅仅说它是边界匹配符就了事了,那如果我问你,什么是边界符匹配呢???你是否能够答上,而不是仅仅背概念那么简单!!!
好,那么看这个例子:
import java.util.regex.Pattern;
import java.util.regex.Matcher;
public class p1{
public static void main(String args[]){
String sta="(??213lang狼13我是华丽分界线中文问号和英文问号?????我是华丽分界线空格 我是华丽分界线换行\n我是华丽分界线制表符 ";
String regex="\\b";
String arrays[]=sta.split(regex);
for(String i:arrays){
System.out.println("["+i+"]");
}
}
}
运行结果:
[(??]
[213lang狼13我是华丽分界线中文问号和英文问号]
[?????]
[我是华丽分界线空格]
[ ]
[我是华丽分界线换行]
[
]
[我是华丽分界线制表符]
[ ]
那么是不是有所启发了??单词边界就是,单词和符号的边界,这里的单词可以是数字、英文单词、中文单词并且这些单词不互斥。而符号可以是英文符号、中文符号、空格、制表符、换行,而符号间不互斥。
就是因为\b是匹配这种边界。所以当我们想判断“ 1 ”用正则规则“\\b1\\b”是否匹配的时候,这是不能够匹配的。因为空格不是边界,而空格和1之间那个边界才是\b匹配的边界。
所以只有当我们这样写才是true
看例子:
public class p4{
public static void main(String args[]){
String sta="1";
String regex="\\b1\\b";
System.out.println(sta.matches(regex));
}
}
运行结果:
true
反之,\B的边界就是单词和单词之间的边界。这种事情根本就是想都不用想了。对不对呢??各位读者??
不过还是来个例子吧!!
首先我要声明\B相当于[^\b]。
看例子:
public class p5{
public static void main(String args[]){
String sta="123lang北斗狼神-,,,,,??????-";
String regex="\\B";
String arrays[]=sta.split(regex);
for(String i:arrays){
System.out.println("["+i+"]");
}
}
}
运行结果:
[1]
[2]
[3]
[l]
[a]
[n]
[g]
[北]
[斗]
[狼]
[神-]
[,]
[,]
[,]
[,]
[,]
[?]
[?]
[?]
[?]
[?]
[?]
[-]
是不是有点让人惊讶??还是你的意料之中??
感觉意料之中的人就不用看下面了,因为你是个很聪明的人。
感觉惊讶的人,也没什么大不了的,因为作者我想的答案和这个答案也是有出入的。
但是不管怎么样,我们都会走上,懂!!!的那条路!!!
在这个例子开始前我也声明过,\B相当于[^\\b]。^是相反的意思,可以查看API。
所以,\b的作用是单词和符号之间的边界。而我们分割的也是单词和符号之间的边界。所以它的相反面就是,单词和符号之间的边界不是我的边界,而单词和单词之间的边界和符号和符号之间的边界就是我的边界。
所以在这个例子中“北斗狼神”中“神”字后面还有一个符号“-”,即:单词和符号之间的边界不是\B的边界,而单词和单词之间的边界和符号和符号之间的边界就是\B的边界。