Java对word文档的操作需要通过第三方组件实现,例如jacob、iText、POI和java2word等。
jacob组件的功能最强大,可以操作word,Excel等格式的文件。该组件调用的的是操作系统底层的dll文件。在使用Java操作word文件时,jacob组件是最常用的一个。
1.准备工作
根据上面的描述,需要两类文件、一个软件:
①jacob.jar
②dll文件
2.开始编程
1 package com.myeclipse;
2
3 import com.jacob.activeX.ActiveXComponent;
4 import com.jacob.com.Dispatch;
5 import com.jacob.com.Variant;
6
7 /**
8 * 使用jacob操作word文档
9 * @author MrChen
10 *
11 */
12 public class JacobOperateDoc{
13
14
15 private ActiveXComponent MSWordApp = null; //声明一个word对象
16 private Dispatch document = null;
17
18
19 /**
20 * 打开word文档
21 * @param makeVisible 是否以可读写方式打开
22 */
23 public void openWord( boolean makeVisible) {
24 if( MSWordApp == null ) {
25 MSWordApp = new ActiveXComponent("Word.Application");
26 }
27 //设置visible
28 Dispatch.put(MSWordApp,"Visible",new Variant(makeVisible));
29
30 }
31
32 /**
33 * 新建word文档
34 */
35 public void createNewDocument() {
36 //获取文档集合
37 Dispatch documents = Dispatch.get(MSWordApp, "Documents").toDispatch();
38 //调用add方法向文档集合中添加一个新的Word文件
39 document = Dispatch.call(documents, "Add").toDispatch();
40 }
41
42 /**
43 * 向word中写入字符串
44 * @param text
45 */
46 public void insertText(String txt) {
47 //获取当前执行写入的位置,如果是新word文件操作位置为文档开始
48 Dispatch selection = Dispatch.get(MSWordApp, "Selection").toDispatch();
49 //将字符串写入
50 Dispatch.put(selection, "Text", txt);
51 }
52
53 /**
54 * 另存为
55 * @param fileName
56 */
57 public void saveFileAs(String fileName) {
58 Dispatch.call(document, "SaveAs",fileName);
59 }
60
61 /**
62 * 打印
63 */
64 public void printFile() {
65 //采用默认打印机打印
66 Dispatch.call(document, "PrintOut");
67 }
68
69 /**
70 * 关闭文档
71 * @param type
72 * 0: 关闭文档不改变保存信息
73 * -1: 关闭文档改变保存信息
74 * -2: 关闭文档提示是否保存改变信息,请求确认
75 */
76 public void closeDocument(Integer type) {
77 //如果关闭类型不正确,则默认为
78 if((type!=0 && type!=-1 && type != -2) || type == null){
79 type = -2;
80 }
81 Dispatch.call(document, "Close", new Variant(type));
82 document = null;
83 }
84
85 /**
86 * 退出
87 */
88 public void closeWord() {
89 Dispatch.call(MSWordApp, "Quit");
90 MSWordApp = null;
91 document = null;
92 }
93 }
JacobOperateDoc
1 package com.myeclipse;
2
3 /**
4 * 测试JacobOperateDoc类
5 * @author MrChen
6 *
7 */
8 public class Test {
9
10 /**
11 * @param args
12 */
13 public static void main(String[] args) {
14 System.out.println("start!");
15 System.out.println(System.getProperty("java.library.path"));
16 JacobOperateDoc jac = new JacobOperateDoc();
17 jac.openWord(true);
18 jac.createNewDocument();
19 jac.insertText("helloworld!");
20 jac.saveFileAs("D:\\hell.doc");
21 try{
22 jac.closeDocument(null);
23 }catch(NullPointerException e){
24 //捕捉空指针异常,什么也不做
25 }
26 jac.closeWord();
27 System.out.println("end!");
28 }
29
30 }
测试JacobOperateDoc类
3.遇见的问题及解决方案
在研究jacob的过程中遇到了一些问题,导致笔者一度想放弃,但这种想法不过一秒而已。笔者一直坚持这样的观点:一件正确的事,既然开始了,就坚持到底,决不放弃!下面是对其中一些问题的摘录。
(1) 执行Test类,报错:Unsupported major.minor version 51.0。
必要的资料:各JDK版本对应的错误编号如下:
J2SE 8 = 52,
J2SE 7 = 51,
J2SE 6.0 = 50,
J2SE 5.0 = 49,
JDK 1.4 = 48,
JDK 1.3 = 47,
JDK 1.2 = 46,
JDK 1.1 = 45。
原因:通过搜寻到的JDK版本对应错误资料,可以得出结论:外部jar包使用jdk1.7(jdk7)编译,而使用此jar包的工程jdk版本为jdk1.6(jdk6),故版本不支持。
解决目标:项目使用的JRE System Library和外用JDK版本保持一致。即修改后是这样的:
解决步骤:
第一大步:修改JDK版本(注:这里本来是一个链接,但博客园非说这个链接有违禁内容,连直接把链接地址粘贴到这里里都不行......故啰嗦下怎么进行)
①修改Eclipse/Myeclipse JDK版本:Window ----> Preference ----> Java ----> Installed JREs。选择相应的JDK版本。
②修改项目的JDK编译版本:项目右键 ----> Java Compiler ----> Enable project specific settings。
----> Myeclipse---->---->---->----> JDK
第二大步:修改JRE system library (点击查看参考文章)
注:这两大步必不可少。
Exception in thread "main" java.lang.UnsatisfiedLinkError: no jacob-1.18-x64 in java.library.path。
错误原因:path路径下找不到jacob-1.18-x64.dll文件
解决方案:
① 找到path路径。
在Test类中增加输出:
System.out.println(System.getProperty("java.library.path"));
执行得到:
D:\Java\jdk1.7.0_80\bin;C:\Windows\Sun\Java\bin;C:\Windows\system32;C:\Windows;D:/Program Files/MyEclipse-8.6/Common/binary/com.sun.java.jdk.win32.x86_1.6.0.013/jre/bin/client; .......(还有很多,不再列举)
② 将dll文件复制到C:\Windows\system32路径之下。
再次执行Test类,成功!
画外音:通过输出path路径,同时也更清楚地看到,Java程序在运行的时候会从前往后扫描path路径,故在解决第一个错误之前使用的JDK版本是1.6。要是早将dll放在C:\Windows\system32路径之下,就不会出现这第二个异常了。
4.进一步了解jacob
(1)jacob是个什么玩意?
jacob一个Java-COM中间件。通过这个组件我们就可以在Java应用程序中调用COM组件和Win32程序库。
(2)为什么我们用java去操纵office(如:word)要使用com,而不直接使用java去做?
office是建立在windows平台之上的,本身是一个软件,除了他自己提供的宏似乎没有什么能对他进行直接的操作。
在windows平台上为了解决像这样的不同应用软件,通信缺乏通用api问题,推出了com的解决方案。
我们使用dll中的一组或多组相关的函数存取组件数据,总的合称为接口(对应jacob,就是Dispatch),具体到每个细节的实现称为方法。
我们使用jacob就是通过一个接口来操作word的ActiveX对象(实质是调用指向接口的指针,这也是唯一途径)。
总结一下,有这么几点:
①Java是与平台无关的语言,不能对平台软件做个性化的操作。
(注:java与dll交互的技术主要有3种:JNI,jawin和jacob。后两种都是基于JNI。)
同时这也说明了为什么本地应用没有office应用就无法进行的原因:如果没有office,则无法建立Java-COM桥,进而无法解析。
5.小结
(1)JDK版本应该保持一致。
(2)dll文件要放在C:\Windows\system32路径之下。
(3)jacob.jar括两个部分:
- com.jacob.activeX: ActiveXComponent类
- com.jacob.com: 其它类和元素
(4)Jacob类
Jacob的结构很简单,包含以下几个类:
- ActiveXComponent Class:封装了Dispatch对象,用于创建一个封装了COM组件对象的Java Object
- Dispatch Class:用于指向封装后的MS数据结构。常用的方法有call,subcall,get,invoke…后面会介绍使用方法。
- Variant Class:用于映射COM的Variant数据类型。提供Java和COM的数据交换。
- ComException Class:异常类
(5)Jacob方法
用于访问COM/DLL对象的方法,读取、修改COM/DLL对象的属性。
- call method:属于Dispatch类。用于访问COM/DLL对象的方法。方法进行了重载,方便不同场合调用。返回一个Variant类型的值。
- callSub method:使用方法和call一样,不过它不返回值。
- get method:读取COM对象的属性值,返回一个Variant类型值。
- put method:设置COM对象的属性值。
- invoke method:call的另一种用法,更复杂一些。
- invokesub method:subcall的另一种用法
- getProperty method:属于ActiveXComponent类,读取属性值,返回一个Variant类型值。
- setProperty method:属于ActiveXComponent类,设置属性值。