GINA之XmlParser和XmlSlurper异同

Groovy Grails XML 


GINA:Groovy In Action  

    Groovy的Document中只是介绍了XmlParser和XmlSlurper常用的用法,而且给你的感觉他俩孪生兄弟,给你相似的同时也给你疑惑


xmlrootelement在哪个包里 xmlslurper_返回结果

 还好在GIA中还有比较好的解释。 


    先来看看他们的相同之处。


  • 构造方法都是一模一样的,从缺省的构造到自定义的reader,parser等完全的一样
  • 解析XML的parse/parseText方法参数也完全的一致,当然了返回结果类型是不一样的
  • 返回结果类型虽然不一样,但是他们处理GPath的语法却是那么一致

其实,处理XML我们比较关注的还是处理Xml的过程,也就是parser的返回结果,可喜的是groovy.util.Node(XmlParser)和GPathResult(XmlSlurper)对GPath的支持都很好,以下简单罗列一下他们常用的共同的方法:

  • name() 返回值:Node->Object,GPathResult->String
  • text() 返回值:String
  • toString() 返回值:String
  • parent() 返回值:Node->Node,GPathResult->GPathResult,快捷方式:'..'
  • children() 返回值:Node->List,GPathResult->GPathResult,快捷方式:'*'
  • attributes() 返回值:Map,在GPathResult中并不存在此方法,但是当是节点类型时候会有此方法(实际上还是调用Node的attributes)
  • iterator() 返回值:Iterator
  • depthFirst() 返回值:Node->List,GPathResult->Iterator,快捷方式:'**'
  • breadthFirst() 返回值:Node->List,GPathResult->Iterator

此外对XML元素和属性的操作也是同样的一致,如下:

    • ['elementName']或.elementName,通过名称访问子元素
    • [index],通过下标访问子元素
    • ['@attributeName']或.'@attributeName',访问属性,GPathResult也可以将引号去掉,直接用.@attributeName访问

        罗嗦了这么多,接下来,让我们实践一下吧

    xmlrootelement在哪个包里 xmlslurper_List_02

    xmlrootelement在哪个包里 xmlslurper_返回结果_03

    1. def CAR_RECORDS = '''  
    2.     <records>  
    3. 'HSV Maloo' make='Holden' year='2006'>  
    4.         <country>Australia</country>  
    5. 'speed'>Production Pickup Truck with speed of 271kph</record>  
    6.       </car>  
    7. 'P50' make='Peel' year='1962'>  
    8.         <country>Isle of Man</country>  
    9. 'size'>Smallest Street-Legal Car at 99cm wide and 59
    10.       </car>  
    11.     </records>  
    12. '''  
    13. def parserRoot = new
    14. def slurperRoot = new
    15. assert 'records'==parserRoot.name()  
    16. assert 'records'==slurperRoot.name()  
    17. assert 2==parserRoot.car.size()  
    18. assert 2==slurperRoot.car.size()  
    19. assert 'P50'==parserRoot.car[1].'@name'
    20. //assert 'P50'==slurperRoot.car[1].@name //error a bug?
    21. assert 'P50'==slurperRoot.car[1].@name.text()  
    22. assert slurperRoot.car[1].@name=='P50'
    23. assert slurperRoot.car.any{ it.@name == 'P50'


    &nbsp;&nbsp;&nbsp;&nbsp;说了那么多行同点,不禁要问既生“XmlParser”又生“XmlSlurper”,何必呢

    xmlrootelement在哪个包里 xmlslurper_返回结果

    ,马上我们来看不同之处。前面也可以看到,它们最大的不同就是parse的返回类型不同,因此主要是groovy.util.Node(XmlParser)和GPathResult(XmlSlurper)的不同。 

    &nbsp;&nbsp;&nbsp;&nbsp;groovy.util.Node是以list的形式来表述GPath的,因此Node在可显性有着明显的优势,比如toString可以直接看到结果,可以直接print,可以在原处修改等等。那缺点呢?显而易见,因为用list来表述,因此也需要额外的内存空间来存储,这在Xml内容小的时候,没啥问题,可一旦处理大量的Xml时,要慎之!慎之!罗列一些Node特有的方法

    • Object value()
    • void setValue(Object value)
    • Object attribute(Object key)
    • NodeList getAt(QName name)
    • void print(PrintWriter out)


    &nbsp;&nbsp;&nbsp;&nbsp;再来看看GPathResult,它没有使用list来处理GPath,而是采用iterators方式,因此没有了额外空间消耗,可是如果要访问最后一个node时候,可要费点时间了

    xmlrootelement在哪个包里 xmlslurper_List_02

     罗列一些GPathResult特有的方法

    • GPathResult parents()
    • GPathResult declareNamespace(Map newNamespaceMapping)
    • List list()
    • int size()
    • GPathResult find(Closure closure)
    • GPathResult findAll(Closure closure)


    &nbsp;&nbsp;&nbsp;&nbsp;总之,两种方式各有优缺点,每个人可以根据实际的情况灵活应用,另外Grails的plugin的doWithWebDescriptor参数就是XmlSlurper。