摘要:
本文介绍了如何在普通Java程序中应用代码动态生成技术,并测试、比较了各种实现方法的性能。
提纲:
一、概述 / 二、表达式计算器 / 三、解释法
四、解析法 / 五、编译法 / 六、生成法 / 七、性能和应用
正文:
一、概述
经常有人批评Java的性能,认为Java程序无法与C或C++程序相提并论。为此,Java一直在性能优化上进行着不懈的努力,特别是运行时的性能优化机制,平息了许多责难。但是,不管Java把性能提高到了什么程度,人们对代码性能的渴求是没有止境的。
显然,Java在某些操作上的性能确实无法与C/C++相比,这是由Java语言的特点所决定的,例如为了跨平台而采用了中间语言(字节码)机制。另一方面,由于Java有着许多独特的特性,它可以利用许多其他语言很难采用的优化技术,动态代码生成就是其中之一。
所谓动态代码生成,就是一种在运行时由程序动态生成代码的过程。动态生成的代码和生成它的程序在同一个JVM中运行,且访问方式也相似。当然,和其他优化技术相似,动态代码生成只适用于某些特定类型的任务。
JSP或许就是人们最熟悉的动态代码生成的例子。Servlet引擎能够把客户的请求分发给Servlet处理,但Servlet天生是一种静态的结构。在启动服务器之前,Servlet一般必须先编译和配置好。虽然Servlet有着许多优点,但在灵活性方面,Servlet略逊一筹。JSP技术突破了Servlet的限制,允许在运行时以JSP文件为基础动态创建Servlet。
当客户程序发出了对JSP文件的请求,Servlet引擎向JSP引擎发出请求,JSP引擎处理JSP文件并返回结果。JSP文件是一系列动作的文本描述,这一系列动作的执行结果就是返回给用户的页面。显然,如果每一个用户的请求到达时都通过解释的方式执行JSP页面,开销肯定比较大。所以,JSP引擎编译JSP页面动态创建Servlet。一旦JSP页面被改变,JSP引擎就会动态地创建新的Servlet。
在这里,动态代码生成技术的优势非常明显——既满足了灵活性的要求,又不致于对性能产生太大的影响。在编译Servlet甚至启动服务器时,系统的行为方式不必完全固定;同时,由于不必在应答每一个请求时解释执行JSP文件,所以也就减少了响应时间。
二、表达式计算器
下面我们来看看如何在普通Java程序中使用动态代码生成技术。本文的例子是一个简单的四则运算表达式计算器,它能够计算形如“4 $0 + $1 *”的后缀表达式,其中$0和$1分别表示变量0、变量1。可能出现在表达式中的符号有三种:变量,常量,操作符。
后缀表达式是一种基于堆栈的计算表达式,处理过程从左到右依次进行,仍以前面的表达式为例:先把4和变量0压入堆栈,下一个字符是操作符“+”,所以把当时栈顶的两个值(4和变量0)相加,然后用加法结果取代栈顶的两个值。接着,再把1压入堆栈,由于接下来的是操作符“*”,所以对这时栈顶的两个值执行乘法操作。如果把这个表达式转换成通常的代数表达式(即中缀表达式),它就是“(4 + $0) * $1”。如果两个变量分别是“[3,6]”,则表达式的计算结果是(4+3)*6=42。
为了比较代码动态生成和常规编程方式的性能差异,我们将以各种不同的方式实现表达式计算器,然后测试各个计算器的性能。
本文的所有表达式计算器都实现(或隐含地实现)calculator接口。calculator接口只有一个evaluate方法,它的输入参数是一个整数数组,返回值是一个表示计算结果的整数。
//Calculator.javapublic interface Calculator { int evaluate(int[] arguments);} |
三、解释法
首先我们来看一个简单但效率不高的表达式计算器,它利用Stack对象计算表达。每次计算,表达式都要重新分析一次,因此可以称为解释法。不过,表达式的符号分析只在对象创建时执行一次,避免StringTokenizer类带来太大的开销。
//SimpleCalculator.javaimport java.util.ArrayList;import java.util.Stack;import java.util.StringTokenizer;public class SimpleCalculator implements Calculator { String[] _toks; // 符号列表 public SimpleCalculator(String expression) { // 构造符号列表 ArrayList list = new ArrayList(); StringTokenizer tokenizer = new StringTokenizer(expression); while (tokenizer.hasMoreTokens()) { list.add(tokenizer.nextToken()); } _toks = (String[]) list.toArray(new String[list.size()]); } // 将变量值代入表达式中的变量, // 然后返回表达式的计算结果 public int evaluate(int[] args) { Stack stack = new Stack(); for (int i = 0; i < _toks.length; i++) { String tok = _toks[i]; // 以‘$’开头的是变量 if (tok.startsWith("$")) { int varnum = Integer.parseInt(tok.substring(1)); stack.push(new Integer(args[varnum])); } else { char opchar = tok.charAt(0); int op = "+-*/".indexOf(opchar); if (op == -1) { // 常量 stack.push(Integer.valueOf(tok)); } else { // 操作符 int arg2 = ((Integer) stack.pop()).intValue(); int arg1 = ((Integer) stack.pop()).intValue(); switch (op) { // 对栈顶的两个值执行指定的操作 case 0: stack.push(new Integer(arg1 + arg2)); break; case 1: stack.push(new Integer(arg1 - arg2)); break; case 2: stack.push(new Integer(arg1 * arg2)); break; case 3: stack.push(new Integer(arg1 / arg2)); break; default: throw new RuntimeException ("操作符不合法: " + tok); } } } } return ((Integer) stack.pop()).intValue(); }}
|
从本文后面的性能测试数据可以看出,这种表达式计算方式的效率相当低。对于偶尔需要计算表达式的场合,它也许适用,但我们还有更好的处理方式。
四、解析法
如果经常要计算表达式的值,一种更好的办法是先解析表达式,应用Composite设计模式,构造一棵表达式树。我们称这种表达式计算方式为解析法。如下面的代码所示,树的内部结构代表了表达式的计算逻辑,因而避免了每次计算表达式时重复分析计算逻辑。
//CalculatorParser.javaimport java.util.Stack;import java.util.StringTokenizer;public class CalculatorParser { public Calculator parse(String expression) { // 分析表达式,构造由表达式各个符号构成的 // 树形结构。 Stack stack = new Stack(); StringTokenizer toks = new StringTokenizer(expression); while (toks.hasMoreTokens()) { String tok = toks.nextToken(); if (tok.startsWith("$")) { // 以‘$’开头的是变量 int varnum = Integer.parseInt(tok.substring(1)); stack.push(new VariableValue(varnum)); } else { int op = "+-*/".indexOf(tok.charAt(0)); if (op == -1) { //常量 int val = Integer.parseInt(tok); stack.push(new ConstantValue(val)); } else { //操作符 Calculator node2 = (Calculator) stack.pop(); Calculator node1 = (Calculator) stack.pop(); stack.push( new Operation(tok.charAt(0), node1, node2)); } } } return (Calculator) stack.pop(); } // 常量 static class ConstantValue implements Calculator { private int _value; ConstantValue(int value) { _value = value; } public int evaluate(int[] args) { return _value; } } // 变量 static class VariableValue implements Calculator { private int _varnum; VariableValue(int varnum) { _varnum = varnum; } public int evaluate(int[] args) { return args[_varnum]; } } // 操作符 static class Operation implements Calculator { char _op; Calculator _arg1; Calculator _arg2; Operation(char op, Calculator arg1, Calculator arg2) { _op = op; _arg1 = arg1; _arg2 = arg2; } public int evaluate(int args[]) { int val1 = _arg1.evaluate(args); int val2 = _arg2.evaluate(args); if (_op == '+') { return val1 + val2; } else if (_op == '-') { return val1 - val2; } else if (_op == '*') { return val1 * val2; } else if (_op == '/') { return val1 / val2; } else { throw new RuntimeException("操作符不合法: " + _op); } } }}
|
由于表达式的计算逻辑已经事先解析好,CalculatorParser的性能明显高于第一个通过解释方式执行的计算器。尽管如此,我们还可以通过代码动态生成技术进一步优化代码。