字符串是Java程序中最常用的数据结构之一。在Java中String类已经重载了"+"。也就是说,字符串可以直接使用"+"进行连接,如下面代码所示:

]String s = “abc” + “ddd”;

但这样做真的好吗?当然,这个问题不能简单地回答yes or no。要根据具体情况来定。在Java中提供了一个StringBuilder类(这个类只在J2SE5及以上版本提供,以前的版本使用StringBuffer类),这个类也可以起到"+"的作用。那么我们应该用哪个呢?

下面让我们先看看如下的代码:

String s = "abc";
String ss = "ok" + s + "xyz" + 5;
System.out.println(ss);

上面的代码将会输出正确的结果。从表面上看,对字符串和整型使用"+"号并没有什么区别,但事实真的如此吗?下面让我们来看看这段代码的本质。

我们首先使用反编译工具(如jdk带的javap、或jad)将TestSimplePlus反编译成Java Byte Code,其中的奥秘就一目了然了。在本文将使用jad来反编译,命令如下:jad -o -a -s d.java TestSimplePlus.class

反编译后的代码如下:

String s = "abc";
    String ss = (new StringBuilder("ok")).append(s).append("xyz").append(5).toString();
    System.out.println(ss);

读者可能看到上面的Java字节码感到迷糊,不过大家不必担心。本文的目的并不是讲解Java Byte Code,因此,并不用了解具体的字节码的含义。

使用jad反编译的好处之一就是可以同时生成字节码和源代码。这样可以进行对照研究。从上面的代码很容易看出,虽然在源程序中使用了"+",但在编译时仍然将"+"转换成StringBuilder。因此,我们可以得出结论,在Java中无论使用何种方式进行字符串连接,实际上都使用的是StringBuilder。

那么是不是可以根据这个结论推出使用"+“和StringBuilder的效果是一样的呢?这个要从两个方面的解释。如果从运行结果来解释,那么”+"和StringBuilder是完全等效的。但如果从运行效率和资源消耗方面看,那它们将存在很大的区别。

当然,如果连接字符串行表达式很简单(如上面的顺序结构),那么"+"和StringBuilder基本是一样的,但如果结构比较复杂,如使用循环来连接字符串,那么产生的Java Byte Code就会有很大的区别。先让我们看看如下的代码:

String s = "";
Random rand = new Random();
for (int i = 0; i < 10; i++){
	s = s + rand.nextInt(1000) + " ";
}
System.out.println(s);

上面的代码返编译后的Java Byte Code如下:

String s = "";
Random rand = new Random();
for(int i = 0; i < 10; i++)
    s = (new StringBuilder(String.valueOf(s))).append(rand.nextInt(1000)).append(" ").toString();
System.out.println(s);

大家可以看到,虽然编译器将"+"转换成了StringBuilder,但创建StringBuilder对象的位置却在for语句内部。这就意味着每执行一次循环,就会创建一个StringBuilder对象(对于本例来说,是创建了10个StringBuilder对象),虽然Java有垃圾回收器,但这个回收器的工作时间是不定的。如果不断产生这样的垃圾,那么仍然会占用大量的资源。解决这个问题的方法就是在程序中直接使用StringBuilder来连接字符串,代码如下:

Random rand = new Random();
StringBuilder result = new StringBuilder();
for (int i = 0; i < 10; i++){
	result.append(rand.nextInt(1000));
	result.append(" ");
}
System.out.println(result.toString());
上面代码反编译后的结果如下:

Random rand = new Random();
StringBuilder result = new StringBuilder();
for(int i = 0; i < 10; i++){
	result.append(rand.nextInt(1000));
	result.append(" ");
}
System.out.println(result.toString());

从上面的反编译结果可以看出,创建StringBuilder的代码被放在了for语句外。虽然这样处理在源程序中看起来复杂,但却换来了更高的效率,同时消耗的资源也更少了。

在使用StringBuilder时要注意,尽量不要"+"和StringBuilder混着用,否则会创建更多的StringBuilder对象,如下面代码所:

for (int i = 0; i < 10; i++){
	result.append(rand.nextInt(1000));
	result.append(" ");
}
改成如下形式:

for (int i = 0; i < 10; i++){     
    result.append(rand.nextInt(1000) + " ");
}
则反编译后的结果如下:

for(int i = 0; i < 10; i++){
	result.append((new StringBuilder(String.valueOf(rand.nextInt(1000)))).append(" ").toString());
}

从上面的代码可以看出,Java编译器将"+“编译成了StringBuilder,这样for语句每循环一次,又创建了一个StringBuilder对象。如果将上面的代码在JDK1.4下编译,必须将StringBuilder改为StringBuffer,而JDK1.4将”+"转换为StringBuffer(因为JDK1.4并没有提供StringBuilder类)。StringBuffer和StringBuilder的功能基本一样,只是StringBuffer是线程安全的,而StringBuilder不是线程安全的。因此,StringBuilder的效率会更高。