XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。XML在不同的语言里解析方式都是一样的,只不过实现的语法不同而已。基本的解析方式有两种,一种叫SAX,另一种叫DOM。SAX是基于事件流的解析,DOM是基于XML文档树结构的解析.
java解析xml常用的四种方法有:
DOM,DOM4J,SAX,JDOM
1.DOM生成和解析XML文档
DOM 解析xml文档时将读取整个文档,然后构建一个驻留内存的树结构,支持删除、修改、重新排列等多种功能。缺点:将整个文档调入内存(包括无用的节点),浪费时间和空间
2.SAX生成和解析XML文档
SAX:事件驱动。当解析器发现元素开始、元素结束、文本、文档的开始或结束等时,发送事件,程序员编写响应这些事件的代码,保存数据。优点:不用事先调入整个文档,占用资源少;SAX解析器代码比DOM解析器代码小,适于Applet,下载。缺点:不是持久的;事件过后,若没保存数据,那么数据就丢了;无状态性;从事件中只能得到文本,但不知该文本属于哪个元素;使用场合:Applet;只需XML文档的少量内容,很少回头访问;机器内存少;
3.JDOM生成和解析XML
极大地减少了代码量,使用简单,操作方便能实现基本的解析、创建等,但在底层,JDOM还是使用SAX(最常用)、DOM、Xanan文档。
4.DOM4J生成和解析XML文档
DOM4J 是一个非常非常优秀的Java XML API,具有性能优异、功能强大和极端易用使用的特点,同时它也是一个开放源代码的软件。如今你可以看到越来越多的 Java 软件都在使用 DOM4J 来读写 XML,包括Hibernate和Sun 的 JAXM 也在用 DOM4J。
本文推荐使用DOM4J,附:DOM4J解析xml源码示例:
public List<Map> readXml(String xmlPath) throws DocumentException {
List list=new ArrayList();
SAXReader saxReader = new SAXReader();
Document doc = saxReader.read(xmlPath);
Element root = doc.getRootElement();
for (Iterator it = root.elementIterator(); it.hasNext();) { Element content = (Element) it.next();
List list = content.attributes();
for (int i = 0; i < list.size(); i++) {
Attribute attr = (Attribute) list.get(i);
String key = attr.getName();
String value = attr.getValue();
map.put(key, value);
}
listMap.add(map); }
return list;
}