XML DOM 定义了访问和处理 XML 文档的标准方法,DOM 是 W3C(万维网联盟)的推荐标准。本文主要介绍 Java DOM 方式处理 XML,文中所使用到的软件版本:Java 1.8.0_191、jaxen 1.2.0。
1、DOM简介
DOM 的全称是 Document Object Model,也即文档对象模型。在应用程序中,基于 DOM 的 XML 分析器将一个 XML 文档转换成一个对象模型的集合(通常称 DOM 树),应用程序正是通过对这个对象模型的操作,来实现对XML文档数据的操作。通过 DOM 接口,应用程序可以在任何时候访问 XML 文档中的任何一部分数据,因此,这种利用DOM接口的机制也被称作随机访问机制。
DOM 接口提供了一种通过分层对象模型来访问 XML 文档信息的方式,这些分层对象模型依据 XML 的文档结构形成了一棵节点树。无论 XML 文档中所描述的是什么类型的信息,即便是制表数据、项目列表或一个文档,利用DOM所生成的模型都是节点树的形式。也就是说,DOM 强制使用树模型来访问XML文档中的信息。由于 XML 本质上就是一种分层结构,所以这种描述方法是相当有效的。
DOM 树所提供的随机访问方式给应用程序的开发带来了很大的灵活性,它可以任意地控制整个XML文档中的内容。然而,由于 DOM 分析器把整个XML文档转化成DOM树放在了内存中,因此,当文档比较大或者结构比较复杂时,对内存的需求就比较高。而且,对于结构复杂的树的遍历也是一项耗时的操作。所以,DOM 分析器对机器性能的要求比较高,实现效率不十分理想。不过,由于 DOM 分析器所采用的树结构的思想与XML文档的结构相吻合,同时鉴于随机访问所带来的方便,因此,DOM 分析器还是有很广泛的使用价值的。
1.1、DOM 的优点
1、可以随意访问文档树的任何部分,没有次数限制。
2、可以随意修改文档树,从而修改XML文档。
3、易于理解,易于开发。
1.2、DOM 的缺点
1、在内存中创建文档树,不适于处理大型XML文档。
2、Java DOM方式操作XML
2.1、XML 文件
<?xml version="1.0" encoding="utf-8" ?> <school:grade xmlns:school="http://www.w3.org/TR/html4/school/"> <school:student rollno="1" school:age="10"> <school:firstname>cxx1</school:firstname> <lastname>Bob1</lastname> <nickname>stars1</nickname> <marks>85</marks> </school:student> <student rollno="2"> <firstname>cxx2</firstname> <lastname>Bob2</lastname> <nickname>stars2</nickname> <marks>85</marks> </student> <student rollno="3"> <firstname>cxx3</firstname> <lastname>Bob3</lastname> <nickname>stars3</nickname> <marks>85</marks> </student> </school:grade>
2.2、Java 代码例子
该例子演示了使用DOM方式解析XML、DOM方式下XPath的使用以及使用DOM方式来生成XML。
package com.abc.demo.general.xml; import org.junit.Test; import org.slf4j.Logger; import org.slf4j.LoggerFactory; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.Node; import org.w3c.dom.NodeList; import javax.xml.namespace.NamespaceContext; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.transform.OutputKeys; import javax.xml.transform.Transformer; import javax.xml.transform.TransformerFactory; import javax.xml.transform.dom.DOMSource; import javax.xml.transform.stream.StreamResult; import javax.xml.xpath.XPath; import javax.xml.xpath.XPathConstants; import javax.xml.xpath.XPathExpression; import javax.xml.xpath.XPathFactory; import java.io.ByteArrayOutputStream; import java.util.Iterator; /** * dom方式处理xml */ public class DomCase { private static Logger logger = LoggerFactory.getLogger(DomCase.class); /** * 解析xml * @throws Exception */ @Test public void parse() throws Exception { DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); //支持命名空间 factory.setNamespaceAware(true); DocumentBuilder builder = factory.newDocumentBuilder(); //解析xml文件为文档 Document document = builder.parse(DomCase.class.getResourceAsStream("student.xml")); Element rootElement = document.getDocumentElement(); NodeList list = rootElement.getChildNodes();//所有学生 // NodeList list = document.getElementsByTagName("school:student"); //第1个学生 // NodeList list = document.getElementsByTagName("student"); //第2、3的学生 // NodeList list = document.getElementsByTagNameNS("http://www.w3.org/TR/html4/school/", "student");//第1个学生 for (int i = 0; i < list.getLength(); i++) { Node node = list.item(i); if (node.getNodeType() != Node.ELEMENT_NODE) { continue; } logger.info("学生编号" + node.getAttributes().getNamedItem("rollno").getTextContent()); if (node.getAttributes().getNamedItem("school:age") != null) { logger.info("age=" + node.getAttributes().getNamedItem("school:age").getTextContent()); } NodeList childNodes = node.getChildNodes(); for (int j = 0; j < childNodes.getLength() ; j++) { Node childNode = childNodes.item(j); if (childNode.getNodeType() == Node.ELEMENT_NODE) { logger.info(childNode.getNodeName() + ":" + childNode.getFirstChild().getNodeValue()); } } } } /** * xpath使用 * @throws Exception */ @Test public void xpath() throws Exception { DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); //支持命名空间 factory.setNamespaceAware(true); DocumentBuilder builder = factory.newDocumentBuilder(); //解析xml文件为文档 Document document = builder.parse(DomCase.class.getResourceAsStream("student.xml")); XPathFactory xPathFactory = XPathFactory.newInstance(); XPath xpath = xPathFactory.newXPath(); xpath.setNamespaceContext(new NamespaceContext() { @Override public String getNamespaceURI(String prefix) { if ("school".equals(prefix)) { return "http://www.w3.org/TR/html4/school/"; } return null; } @Override public String getPrefix(String namespaceURI) { return null; } @Override public Iterator getPrefixes(String namespaceURI) { return null; } }); logger.info("查找所有的存在rollno属性的student节点,取出lastname的值"); XPathExpression expr = xpath.compile("//student[@rollno]/lastname/text()");//第2、3位学生 // XPathExpression expr = xpath.compile("//student[@rollno]/child::lastname/text()");//效果同上 // XPathExpression expr = xpath.compile("//school:student[@rollno]/lastname/text()");//第1位学生 Object result = expr.evaluate(document, XPathConstants.NODESET); NodeList nodes = (NodeList) result; for (int i = 0; i < nodes.getLength(); i++) { logger.info(nodes.item(i).getNodeValue()); } } /** * 生成xml */ @Test public void toXml() throws Exception { DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = factory.newDocumentBuilder(); //新建一个文档对象 Document document = builder.newDocument(); Element elementClass = document.createElementNS("http://www.w3.org/TR/html4/school/", "school:class"); //第一个学生 Element elementStudent1 = document.createElement("student"); elementStudent1.setAttribute("rollno", "1"); elementStudent1.setAttributeNS("http://www.w3.org/TR/html4/school/", "school:age", "10"); Element elementFirstname1 = document.createElement("school:firstname"); elementFirstname1.setTextContent("cxx1"); Element elementLastname1 = document.createElement("lastname"); elementLastname1.setTextContent("Bob1"); Element elementNickname1 = document.createElement("nickname"); elementNickname1.setTextContent("stars1"); Element elementMarks1 = document.createElement("marks"); elementMarks1.setTextContent("85"); elementStudent1.appendChild(elementFirstname1); elementStudent1.appendChild(elementLastname1); elementStudent1.appendChild(elementNickname1); elementStudent1.appendChild(elementMarks1); elementClass.appendChild(elementStudent1); //第二个学生 Element elementStudent2 = document.createElement("student"); elementStudent2.setAttribute("rollno", "2"); Element elementFirstname2 = document.createElement("firstname"); elementFirstname2.setTextContent("cxx2"); Element elementLastname2 = document.createElement("lastname"); elementLastname2.setTextContent("Bob2"); Element elementNickname2 = document.createElement("nickname"); elementNickname2.setTextContent("stars2"); Element elementMarks2 = document.createElement("marks"); elementMarks2.setTextContent("85"); elementStudent2.appendChild(elementFirstname2); elementStudent2.appendChild(elementLastname2); elementStudent2.appendChild(elementNickname2); elementStudent2.appendChild(elementMarks2); elementClass.appendChild(elementStudent2); //第三个学生 Element elementStudent3 = document.createElement("student"); elementStudent3.setAttribute("rollno", "3"); Element elementFirstname3 = document.createElement("firstname"); elementFirstname3.setTextContent("cxx3"); Element elementLastname3 = document.createElement("lastname"); elementLastname3.setTextContent("Bob3"); Element elementNickname3 = document.createElement("nickname"); elementNickname3.setTextContent("stars3"); Element elementMarks3 = document.createElement("marks"); elementMarks3.setTextContent("85"); elementStudent3.appendChild(elementFirstname3); elementStudent3.appendChild(elementLastname3); elementStudent3.appendChild(elementNickname3); elementStudent3.appendChild(elementMarks3); elementClass.appendChild(elementStudent3); document.appendChild(elementClass); TransformerFactory transformerFactory = TransformerFactory.newInstance(); Transformer transformer = transformerFactory.newTransformer(); transformer.setOutputProperty(OutputKeys.ENCODING,"utf-8"); //换行 transformer.setOutputProperty(OutputKeys.INDENT, "yes"); DOMSource domSource = new DOMSource(document); //xml输出到的地方 ByteArrayOutputStream out = new ByteArrayOutputStream(); StreamResult streamResult = new StreamResult(out); transformer.transform(domSource, streamResult); logger.info(out.toString()); } }