XML
XML 指可扩展标记语言(eXtensible Markup Language)。被设计用来传输和存储数据。
一、特性
- xml具有平台无关性,是一门独立的标记语言
- xml具有自我描述性
二、作用
- 网络数据传输
- 数据存储
- 配置文件
三、XML树结构
XML 文档形成了一种树结构,它从"根部"开始,然后扩展到"枝叶"。
<?xml version="1.0" encoding="UTF-8"?>
<note>
<to>Qs</to>
<from>Sky</from>
<heading>Reminder</heading>
<body>Don't forget to date this weekend!</body>
</note>
第一行是xml声明,定义 XML 的版本(1.0)和所使用的编码(UTF-8 : 万国码, 可显示各种语言)。
四、语法点
- 对大小写敏感
- XML 文档必须有根元素
- 所有 XML 元素都必须有一个关闭标签
- XML 属性值必须加引号
- 实体引用
实体 | 字符 | 描述 |
| < | less than |
| > | greater than |
| & | ampersand |
| ’ | apostrophe |
| " | quotation mark |
在 XML 中,只有字符 “<” 和 “&” 确实是非法的。大于号是合法的,但是用实体引用来代替它是一个好习惯。
- XML 中的注释
<!-- This is a comment -->
- 在 XML 中,空格会被保留,HTML 会把多个连续的空格字符裁减(合并)为一个
- XML 以 LF 存储换行
- 在 Windows 应用程序中,换行通常以一对字符来存储:回车符(CR)和换行符(LF)。
- 在 Unix 和 Mac OSX 中,使用 LF 来存储新行。
- 在旧的 Mac 系统中,使用 CR 来存储新行。
- XML 以 LF 存储换行。
- XML 命名规则
- 名称可以包含字母、数字以及其他的字符
- 名称不能以数字或者标点符号开始
- 名称不能以字母 xml(或者 XML、Xml 等等)开始
- 名称不能包含空格
- 标记名称允许重复
- XML 元素是可扩展的,XML 的优势之一,就是可以在不中断应用程序的情况下进行扩展
五、Java中有XML解析方式
5.1 SAX解析
- 解析方式是事件驱动机制!
- SAX解析器,逐行读取XML文件解析,每当解析到一个标签的开始/结束/内容/属性时,触 发事件
- 我们可以编写程序在这些事件发生时,进行相应的处理
缺点:
- 单向解析,无法定位文档层次,无法同时访问同一文档的不同部分数据(因为逐 行解析,当解析第n行是,第n-1行已经被释放了,无法在进行操作了)。
- 无法得知事件发生时元素的层次, 只能自己维护节点的父/子关系
- 只读解析方式,无法修改XML文档的内容。
5.2 DOM解析
是用与平台和语言无关的方式表示XML文档的官方W3C标准,分析该结构通常需要加载整个 文档和内存中建立文档树模型.程序员可以通过操作文档树, 来完成数据的获取 修改 删除等
优点:
- 文档在内存中加载,允许对数据和结构做出更改
- 双向访问,可以在任何时候在树中双向解析数据。
缺点:文档全部加载在内存中,消耗资源大
5.3 JDOM解析
- 目的是成为Java特定文档模型,它简化与XML的交互并且比使用DOM实现更快。由于是第一 个Java特定模型,JDOM一直得到大力推广和促进
- JDOM文档声明其目的是“使用20%(或更少)的精力解决80%(或更多)Java/XML问题” (根据学习曲线假定为20%)
缺点:没有较好的灵活性;没有较好的灵活性。
5.4 DOM4J解析
它是JDOM的一种智能分支。它合并了许多超出基本XML文档表示的功能,包括集成的XPath 支持、XML Schema支持以及用于大文档或流化文档的基于事件的处理。它还提供了构建文档表示的选项, DOM4J是一个非常优秀的Java XML API,具有性能优异、功能强大和极端易用使用的特点,同时它也是一 个开放源代码的软件。
5.5 DOM4J解析XML
步骤:
- 引入jar文件 dom4j.jar
- 创建一个指向XML文件的输入流
FileInputStream fis = new FileInputStream("xml文件的地址");
- 创建一个XML读取工具对象
SAXReader sr = new SAXReader();
- 使用读取工具对象, 读取XML文档的输入流,并得到文档对象
Document doc = sr.read(fis);
- 通过文档对象,获取XML文档中的根元素对象
Element root = doc.getRootElement();
5.5.1 文档对象 Document
指的是加载到内存的整个XML文档
常用方法:
- 通过文档对象, 获取XML文档中的根元素对象
Element root = doc.getRootElement();
- 添加根节点
Element root = doc.addElement("根节点名称");
5.5.2 元素对象 Element
指的是XML文档中的单个节点
常用方法:
- 获取节点名称
String getName();
- 获取节点内容
String getText();
- 设置节点内容
String setText();
- 根据子节点的名称,获取匹配名称的第一个子节点对象
Element element(String 子节点名称);
- 获取所有的子节点对象
List elements();
- 获取节点的属性值
String attributeValue(String 属性名称);
- 获取子节点的内容
String elementText(String 子节点名称);
- 添加子节点
Element addElement(String 子节点名称);
- 添加属性
void addAttribute(String 属性名,String 属性值);
5.5.3 DOM4J - XPATH解析XML
- 路径表达式,通过路径快速的查找一个或一组元素
- / : 从根节点开始查找
- // : 从发起查找的节点位置 查找后代节点
- . : 查找当前节点
- … : 查找父节点
- @ : 选择属性
属性使用方式:
[@属性名='值']
[@属性名>'值']
[@属性名<'值']
[@属性名!='值']
- 使用步骤
//通过Node类的两个方法, 来完成查找:
//(Node是 Document 与 Element 的父接口)
//方法1.
//根据路径表达式, 查找匹配的单个节点
Element e = selectSingleNode("路径表达式");
//方法2.
List<Element> es = selectNodes("路径表达式");
5.6 Java生成XML
步骤:
- 通过文档帮助器 (DocumentHelper) , 创建空的文档对象
Document doc = DocumentHelper.createDocument();
- 通过文档对象, 向其中添加根节点
Element root = doc.addElement("根节点名称");
- 通过根节点对象root , 丰富我们的子节点
Element e = root.addElement("元素名称");
- 创建一个文件输出流 ,用于存储XML文件
FileOutputStream fos = new FileOutputStream("要存储的位置");
- 将文件输出流, 转换为XML文档输出流
XMLWriter xw = new XMLWriter(fos);
- 写出文档
xw.write(doc);
- 释放资源
xw.close();
//1. 通过文档帮助器, 创建空的文档对象
Document doc = DocumentHelper.createDocument();
//2. 向文档对象中, 加入根节点对象
Element books = doc.addElement("books");
//3. 向根节点中 丰富子节点
for(int i=0;i<1000;i++) {
//向根节点中加入1000个book节点.
Element book = books.addElement("book");
//向book节点, 加入id属性
book.addAttribute("id", 1+i+"");
//向book节点中加入name和info节点
Element name = book.addElement("name");
Element info = book.addElement("info");
name.setText("苹果"+i);
info.setText("哈哈哈"+i);
}
//4. 创建文件的输出流
FileOutputStream fos = new FileOutputStream("c:\\books.xml");
//5. 将文件输出流 , 转换为XML文档输出流
XMLWriter xw = new XMLWriter(fos);
//6. 写出XML文档
xw.write(doc);
//7. 释放资源
xw.close();
System.out.println("代码执行完毕");
5.7 XStream 的使用
快速的将Java中的对象, 转换为 XML字符串
步骤:
- 创建XStream 对象
XStream x = new XStream();
- 修改类生成的节点名称 (默认节点名称为 包名.类名)
x.alias("节点名称",类名.class);
- 传入对象 , 生成XML字符串
String xml字符串 = x.toXML(对象);
Person p = new Person(1001, "张三", "不详");
XStream x = new XStream();
x.alias("haha", Person.class);
String xml = x.toXML(p);
System.out.println(xml);