跟前两篇文章一样,我们继续使用books.xml和Book类,在此不再赘述,直接给出代码:

package domain;

public class Book {
    private int id;
    private String name;
    private String author;
    private float price;

    public int getId() {
        return id;
    }

    public void setId(int id) {
        this.id = id;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public String getAuthor() {
        return author;
    }

    public void setAuthor(String author) {
        this.author = author;
    }

    public float getPrice() {
        return price;
    }

    public void setPrice(float price) {
        this.price = price;
    }

    @Override
    public String toString() {
        return "Book [id=" + id + ", name=" + name + ", author=" + author + ", price=" + price + "]";
    }

}
<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
    <book id="1">
        <name>冰与火之歌</name>
        <author>乔治马丁</author>
        <price>89</price>
    </book>
    <book id="2">
        <name>安徒生童话</name>
        <author>安徒生</author>
        <price>24</price>
    </book>
</bookstore>

JDOM不是Java官方提供的解析方式,所以要想使用JDOM解析XML文件,首先需要下载JDOM的JAR包。

下载解压后有如下文件:

Java 解析 mdb文件_Java 解析 mdb文件

这里我们只需使用jdom-2.0.6.jar即可。
导入JAR包的过程不再赘述,需要的可以自行百度。


要使用JDOM解析,有以下步骤:

  • 创建SAXBuilder类的对象
  • 创建一个输入流,将XML文件加载到输入流中【可选】(使用输入流是为了防止和解决中文乱码问题)
  • 使用SAXBuilder类的build()方法,并将输入流加载到SAXBuilder中
  • 获取XML文件的根节点
  • 获取根节点下的所有子节点
  • 开始解析

创建SAXBuilder类的对象:

// 创建SAXBuilder的对象
SAXBuilder builder = new SAXBuilder();

创建一个输入流:

/*
 * 还可以创建一个输入流(为了防止乱码), 将XML文件加载到输入流中, 再将输入流加载到SAXBuilder的build方法中去
 */
FileInputStream in;
InputStreamReader isr = null;
try {
    in = new FileInputStream(file);
    isr = new InputStreamReader(in, "UTF-8");
} catch (FileNotFoundException e1) {
    e1.printStackTrace();
} catch (UnsupportedEncodingException e) {
    e.printStackTrace();
}

使用SAXBuilder类的build()方法,并将输入流加载到其中:

// 将输入流加载到SAXBuilder的build方法中
Document document = builder.build(isr);

获取XML文件的根节点:

// 获取XML文件的根节点
Element root = document.getRootElement();

获取根节点下的所有子节点:

// 获取根节点的所有子节点
List<Element> bookList = root.getChildren();

至此,我们已经获取到了所有的子节点(即本例中的book),接下来,就可以对每一本书进行解析了。


既然我们已经获取了所有的book,接下来,需要遍历每一个book,并解析他们的属性和子节点的值。

通过每一个Element(即book),我们可以使用getAttributes()方法获取该book的所有属性,然后我们可以对这些属性进行遍历。通过Attribute的getName()方法可以获取到每个属性的属性名,通过getValue()方法可以获取到每个属性的属性值。这样,我们就可以将所有属性解析出来。

接下来,就该解析每个子节点的值了。
通过getChildren()方法,我们可以获取到每个book节点的所有子节点childNode,使用childNode的getName()方法和getValue()方法,可以获取到每个子节点的名和值,这样我们就可以将节点值封装进对象对应的属性中了。

for (Element book : bookList) {
    // 用于存储每一本书的信息
    Book aBook = new Book();

    // 获取并遍历当前节点的所有属性
    List<Attribute> attributes = book.getAttributes();
    for (Attribute attribute : attributes) {
        switch (attribute.getName()) {
        case "id":
            // 此处的getValue()不会获取由空格、换行组成的值,即:获取到的都是有效值
            aBook.setId(Integer.valueOf(attribute.getValue()));
            break;
        }
    }

    // 获取当前book的所有子节点的值
    List<Element> childNodes = book.getChildren();
    for (Element childNode : childNodes) {
        switch (childNode.getName()) {
        case "name":
            aBook.setName(childNode.getValue());
            break;
        case "author":
            aBook.setAuthor(childNode.getValue());
            break;
        case "price":
            aBook.setPrice(Float.valueOf(childNode.getValue()));
            break;
        }
    }

    // 将当前book存入List中
    books.add(aBook);
    // 将aBook设置为空,交给垃圾处理机制回收
    aBook = null;
}

至此,JDOM解析XML文件的工具类就写好了。下面是完整的工具类代码:

package util;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.UnsupportedEncodingException;
import java.util.ArrayList;
import java.util.List;

import org.jdom2.Attribute;
import org.jdom2.Document;
import org.jdom2.Element;
import org.jdom2.JDOMException;
import org.jdom2.input.SAXBuilder;

import domain.Book;

public class ParseUtil {

    // 用于存储所有书
    private List<Book> books = new ArrayList<Book>();

    public void parseXMLByJDOM(File file) {
        // 创建SAXBuilder的对象
        SAXBuilder builder = new SAXBuilder();

        /*
         * 还可以创建一个输入流(为了防止乱码), 将XML文件加载到输入流中, 再将输入流加载到SAXBuilder的build方法中去
         */
        FileInputStream in;
        InputStreamReader isr = null;
        try {
            in = new FileInputStream(file);
            isr = new InputStreamReader(in, "UTF-8");
        } catch (FileNotFoundException e1) {
            e1.printStackTrace();
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }

        try {
            // 将输入流加载到SAXBuilder的build方法中
            Document document = builder.build(isr);

            // 获取XML文件的根节点
            Element root = document.getRootElement();

            // 获取根节点的所有子节点
            List<Element> bookList = root.getChildren();

            for (Element book : bookList) {
                // 用于存储每一本书的信息
                Book aBook = new Book();

                // 获取并遍历当前节点的所有属性
                List<Attribute> attributes = book.getAttributes();
                for (Attribute attribute : attributes) {
                    switch (attribute.getName()) {
                    case "id":
                        // 此处的getValue()不会获取由空格、换行组成的值,即:获取到的都是有效值
                        aBook.setId(Integer.valueOf(attribute.getValue()));
                        break;
                    }
                }

                // 获取当前book的所有子节点的值
                List<Element> childNodes = book.getChildren();
                for (Element childNode : childNodes) {
                    switch (childNode.getName()) {
                    case "name":
                        aBook.setName(childNode.getValue());
                        break;
                    case "author":
                        aBook.setAuthor(childNode.getValue());
                        break;
                    case "price":
                        aBook.setPrice(Float.valueOf(childNode.getValue()));
                        break;
                    }
                }

                // 将当前book存入List中
                books.add(aBook);
                // 将aBook设置为空,交给垃圾处理机制回收
                aBook = null;
            }

            // 输出所有解析到的书的信息
            System.out.println(books);

        } catch (JDOMException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    public List<Book> getBooks() {
        return books;
    }

    public void setBooks(List<Book> books) {
        this.books = books;
    }

}

通过测试,可以得到如下结果:

[Book [id=1, name=冰与火之歌, author=乔治马丁, price=89.0], Book [id=2, name=安徒生童话, author=安徒生, price=24.0]]

可见解析成功。


【需要注意的是】

在使用JDOM解析XML文件时,可能会出现中文乱码问题。

乱码往往是由于编码不匹配而产生的,所以我们可以通过下面两种方式解决乱码问题:

  • 修改XML文件的encoding属性的值
  • 将InputStream包装成InputStreamReader,并指定字符集