问题抛出

在问题4的Problem1中的getMentionedUsers函数。其中需要去匹配@和后面的合法的用户名。从而获得某个人@了哪些用户。并且不能匹配类似邮箱中的@字符。在使用正则表达式的时候,我想到的是用@前面不能是用户名的合法字符,@的后面是1个或多个用户名的合法字符,所以一开始我写的正则表达式是

Pattern = “[^a-zA-Z0-9_-]@[a-zA-Z0-9_-]+”;

经过网页上的在线测试,可以正确识别出我们要找的字符。

正则表达式 不匹配字符串 java java正则表达式匹配不到_java正则表达式


但是在Java中的程序却无法正确识别:(代码和输出结果如图)

正则表达式 不匹配字符串 java java正则表达式匹配不到_用户名_02


正则表达式 不匹配字符串 java java正则表达式匹配不到_正则表达式_03

原因

在百度上找了许多关于“正则表达式在线测试能够匹配,java却无法匹配”的问题。

原因是:Java中的”\”需要经过转义,因此我们需要输入”\”来表示输入一个“\”。

正则表达式 不匹配字符串 java java正则表达式匹配不到_用户名_04


正则表达式 不匹配字符串 java java正则表达式匹配不到_正则表达式_05

解决

但是将写的正则表达式进行转义等还是无法识别。考虑到可能是全局匹配的问题。因此在正则表达式前面加上 ”.” ( .连在一起就意味着任意数量的不包含换行的字符 )。

Pattern = “.*[^a-zA-Z0-9_-]@[a-zA-Z0-9_-]+”;

经过测试成功。

正则表达式 不匹配字符串 java java正则表达式匹配不到_正则表达式_06


我们使用下面的代码来进行多次匹配:

while(m.find())
{
        // 处理
        String string = m.group();
}

其他发现

同时发现另外一个问题,在匹配具有多个@的时候,这时只能找到最后一个@。经过查询百度,发现匹配是有惰性匹配和贪婪匹配以及支配匹配的。为了让匹配尽量少。所以正则表达式写成:
Pattern = “.*?[^a-zA-Z0-9_-]@[a-zA-Z0-9_-]+”;
至此,正确完成功能。

参考

惰性匹配和贪婪匹配以及支配匹配:http://www.jb51.net/article/62876.htm
java正则表达式语法:http://www.runoob.com/java/java-regular-expressions.html