Groovy Tip 35  正则表达式 四
 
 
 
我们知道,在正则表达式中,有一些字符串被用来的表达一些特殊的用途。比如,"."代表的是所有的字符;"^"代表的是非;等等。看到这些用法的时候,我们就可以反过来问了,如果"."代表的是所有的字符的话,那么用什么来匹配字符串中的"."呢?
为了解决这样的问题,在正则表达式中需要用"/"加上原字符串来匹配这样的字符。下面来举一个例子:
 
      println 'a.c' ==~ /a/.c/
    
运行结果为:
true
 
 
其他的这样一些字符还有:"{"、"["、"("、")"、"/"、"^"、"$"、"|"、"?"、"*"和"+"等等。
知道了这样的原则,我们就能理解我们在编码过程中的一些奇怪问题,比如我们经常操作文件名字符串,如下所示的一个文件名:
 
      def fn = 'test.txt'
  
我们就想拆分出文件名和类型来,经常我们想用split方法,如下所示:
 
      def fns = fn.split('.')
      
      println fns
  
 
这个想法很直接,也很简单,但运行的结果却是:
{}
 
这显然不是我们想要的结果。
问题出在哪里呢?就是因为"."是匹配所有的字符的,它能够匹配"test.txt"中的任何一个字符,所以做split方法也就无法下手了。
正确的代码如下:
 
      def fns1 = fn.split(//./)
      
      println fns1
    
 
运行结果为:
{"test", "txt"}
 
 
这才是我们想要的结果。
值得注意的是,"."并不真正的是匹配所有的字符,有些字符它也不能匹配,如下面的代码是可以匹配的:
 
      println 'abc/ndef' ==~ /a.c/ndef/
  
 
运行结果为:
true
 
 
但下面的代码就不能匹配了:
 
      println 'abc/ndef' ==~ /abc.def/
  
 
运行结果为:
false
 
 
即"."并不能匹配"/n"--换行符。
如果我们非要"."来匹配所有的字符,也是有办法的,"(?s)"来强制它匹配所有的字符,示例代码如下:
 
      println 'abc/ndef' ==~ /(?s)abc.def/
  
 
运行结果为:
true
 
对于"(?s)"这样的东东,我们称之为标志(flag),除了"(?s)"标志外,还有几个标志比较有用。
首先是"(?i)",用来作为忽略大小写的标志,如下的示例代码:
 
      println 'abcDEF' ==~ /abc(?i)def/
  
 
运行结果为:
true
 
 
如果是下面的代码:
 
      println 'abcDEF' ==~ /abcdef/
    
 
运行结果就是:
false
 
 
既然"(?i)",用来作为忽略大小写的标志,就需要一个结束忽略大小写的标志。这就是"(?-i)",如下面的代码就是匹配的:
 
      println 'abcDEFg' ==~ /abc(?i)def(?-i)g/
  
 
运行结果为:
true
 
而下面的代码则是不匹配的:
 
      println 'abcDEFG' ==~ /abc(?i)def(?-i)g/
  
 
运行结果为:
false