跟前两篇文章一样,我们继续使用books.xml和Book类,在此不再赘述,直接给出代码:
package domain;
public class Book {
private int id;
private String name;
private String author;
private float price;
public int getId() {
return id;
}
public void setId(int id) {
this.id = id;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public String getAuthor() {
return author;
}
public void setAuthor(String author) {
this.author = author;
}
public float getPrice() {
return price;
}
public void setPrice(float price) {
this.price = price;
}
@Override
public String toString() {
return "Book [id=" + id + ", name=" + name + ", author=" + author + ", price=" + price + "]";
}
}
<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
<book id="1">
<name>冰与火之歌</name>
<author>乔治马丁</author>
<price>89</price>
</book>
<book id="2">
<name>安徒生童话</name>
<author>安徒生</author>
<price>24</price>
</book>
</bookstore>
JDOM不是Java官方提供的解析方式,所以要想使用JDOM解析XML文件,首先需要下载JDOM的JAR包。
下载解压后有如下文件:
这里我们只需使用jdom-2.0.6.jar
即可。
导入JAR包的过程不再赘述,需要的可以自行百度。
要使用JDOM解析,有以下步骤:
- 创建SAXBuilder类的对象
- 创建一个输入流,将XML文件加载到输入流中【可选】(使用输入流是为了防止和解决中文乱码问题)
- 使用SAXBuilder类的build()方法,并将输入流加载到SAXBuilder中
- 获取XML文件的根节点
- 获取根节点下的所有子节点
- 开始解析
创建SAXBuilder类的对象:
// 创建SAXBuilder的对象
SAXBuilder builder = new SAXBuilder();
创建一个输入流:
/*
* 还可以创建一个输入流(为了防止乱码), 将XML文件加载到输入流中, 再将输入流加载到SAXBuilder的build方法中去
*/
FileInputStream in;
InputStreamReader isr = null;
try {
in = new FileInputStream(file);
isr = new InputStreamReader(in, "UTF-8");
} catch (FileNotFoundException e1) {
e1.printStackTrace();
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
使用SAXBuilder类的build()方法,并将输入流加载到其中:
// 将输入流加载到SAXBuilder的build方法中
Document document = builder.build(isr);
获取XML文件的根节点:
// 获取XML文件的根节点
Element root = document.getRootElement();
获取根节点下的所有子节点:
// 获取根节点的所有子节点
List<Element> bookList = root.getChildren();
至此,我们已经获取到了所有的子节点(即本例中的book),接下来,就可以对每一本书进行解析了。
既然我们已经获取了所有的book,接下来,需要遍历每一个book,并解析他们的属性和子节点的值。
通过每一个Element(即book),我们可以使用getAttributes()
方法获取该book的所有属性,然后我们可以对这些属性进行遍历。通过Attribute的getName()
方法可以获取到每个属性的属性名,通过getValue()
方法可以获取到每个属性的属性值。这样,我们就可以将所有属性解析出来。
接下来,就该解析每个子节点的值了。
通过getChildren()
方法,我们可以获取到每个book节点的所有子节点childNode,使用childNode的getName()
方法和getValue()
方法,可以获取到每个子节点的名和值,这样我们就可以将节点值封装进对象对应的属性中了。
for (Element book : bookList) {
// 用于存储每一本书的信息
Book aBook = new Book();
// 获取并遍历当前节点的所有属性
List<Attribute> attributes = book.getAttributes();
for (Attribute attribute : attributes) {
switch (attribute.getName()) {
case "id":
// 此处的getValue()不会获取由空格、换行组成的值,即:获取到的都是有效值
aBook.setId(Integer.valueOf(attribute.getValue()));
break;
}
}
// 获取当前book的所有子节点的值
List<Element> childNodes = book.getChildren();
for (Element childNode : childNodes) {
switch (childNode.getName()) {
case "name":
aBook.setName(childNode.getValue());
break;
case "author":
aBook.setAuthor(childNode.getValue());
break;
case "price":
aBook.setPrice(Float.valueOf(childNode.getValue()));
break;
}
}
// 将当前book存入List中
books.add(aBook);
// 将aBook设置为空,交给垃圾处理机制回收
aBook = null;
}
至此,JDOM解析XML文件的工具类就写好了。下面是完整的工具类代码:
package util;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.UnsupportedEncodingException;
import java.util.ArrayList;
import java.util.List;
import org.jdom2.Attribute;
import org.jdom2.Document;
import org.jdom2.Element;
import org.jdom2.JDOMException;
import org.jdom2.input.SAXBuilder;
import domain.Book;
public class ParseUtil {
// 用于存储所有书
private List<Book> books = new ArrayList<Book>();
public void parseXMLByJDOM(File file) {
// 创建SAXBuilder的对象
SAXBuilder builder = new SAXBuilder();
/*
* 还可以创建一个输入流(为了防止乱码), 将XML文件加载到输入流中, 再将输入流加载到SAXBuilder的build方法中去
*/
FileInputStream in;
InputStreamReader isr = null;
try {
in = new FileInputStream(file);
isr = new InputStreamReader(in, "UTF-8");
} catch (FileNotFoundException e1) {
e1.printStackTrace();
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
try {
// 将输入流加载到SAXBuilder的build方法中
Document document = builder.build(isr);
// 获取XML文件的根节点
Element root = document.getRootElement();
// 获取根节点的所有子节点
List<Element> bookList = root.getChildren();
for (Element book : bookList) {
// 用于存储每一本书的信息
Book aBook = new Book();
// 获取并遍历当前节点的所有属性
List<Attribute> attributes = book.getAttributes();
for (Attribute attribute : attributes) {
switch (attribute.getName()) {
case "id":
// 此处的getValue()不会获取由空格、换行组成的值,即:获取到的都是有效值
aBook.setId(Integer.valueOf(attribute.getValue()));
break;
}
}
// 获取当前book的所有子节点的值
List<Element> childNodes = book.getChildren();
for (Element childNode : childNodes) {
switch (childNode.getName()) {
case "name":
aBook.setName(childNode.getValue());
break;
case "author":
aBook.setAuthor(childNode.getValue());
break;
case "price":
aBook.setPrice(Float.valueOf(childNode.getValue()));
break;
}
}
// 将当前book存入List中
books.add(aBook);
// 将aBook设置为空,交给垃圾处理机制回收
aBook = null;
}
// 输出所有解析到的书的信息
System.out.println(books);
} catch (JDOMException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
public List<Book> getBooks() {
return books;
}
public void setBooks(List<Book> books) {
this.books = books;
}
}
通过测试,可以得到如下结果:
[Book [id=1, name=冰与火之歌, author=乔治马丁, price=89.0], Book [id=2, name=安徒生童话, author=安徒生, price=24.0]]
可见解析成功。
【需要注意的是】
在使用JDOM解析XML文件时,可能会出现中文乱码问题。
乱码往往是由于编码不匹配而产生的,所以我们可以通过下面两种方式解决乱码问题:
- 修改XML文件的encoding属性的值
- 将InputStream包装成InputStreamReader,并指定字符集