01 switch 支持 String 与枚举
从 Java 7 开始,Java 语言中的语法糖在逐渐丰富,其中一个比较重要的就是 Java 7 中 switch 开始支持 String。
在开始 coding 之前先科普下,Java 中的 swith 自身原本就支持基本类型。比如 int、char 等。
对于 int 类型,直接进行数值的比较。对于 char 类型则是比较其 ascii 码。
所以,对于编译器来说,switch 中其实只能使用整型,任何类型的比较都要转换成整型。比如 byte。short,char(ackii 码是整型)以及 int。
那么接下来看下 switch 对 String 的支持,有以下代码:
String str = "world";
witch (str) {case "hello":
System.out.println("hello");break;case "world":
System.out.println("world");break;default:break;
}
反编译后内容如下:
String str = "world";
String s;switch((s =str).hashCode()){default:break;case 99162322:if(s.equals("hello"))
System.out.println("hello");break;case 113318802:if(s.equals("world"))
System.out.println("world");break;
}
看到这个代码,你知道原来字符串的 switch 是通过 equals()和hashCode()方法来实现的。还好 hashCode()方法返回的是 int,而不是 long。
仔细看下可以发现,进行 switch 的实际是哈希值,然后通过使用 equals 方法比较进行安全检查,这个检查是必要的,因为哈希可能会发生碰撞。因此它的性能是不如使用枚举进行 switch 或者使用纯整数常量,但这也不是很差。
02 泛型
我们都知道,很多语言都是支持泛型的,但是很多人不知道的是,不同的编译器对于泛型的处理方式是不同的。
通常情况下,一个编译器处理泛型有两种方式:Code specialization和Code sharing。
C++和C#是使用 Code specialization 的处理机制,而 Java 使用的是 Code sharing 的机制。
Code sharing 方式为每个泛型类型创建唯一的字节码表示,并且将该泛型类型的实例都映射到这个唯一的字节码表示上。将多种泛型类形实例映射到唯一的字节码表示是通过类型擦除(type erasue)实现的。
也就是说,对于 Java 虚拟机来说,他根本不认识 Map map 这样的语法。需要在编译阶段通过类型擦除的方式进行解语法糖。
类型擦除的主要过程如下:
1. 将所有的泛型参数用其最左边界(最顶级的父类型)类型替换。
2. 移除所有的类型参数。
以下代码:
Map map = new HashMap();
map.put("name", "xuexue");
map.put("age", "100");
map.put("blog", "**.**.com");
解语法糖之后会变成:
Map map = newHashMap();
map.put("name", "xuexue");
map.put("age", "100");
map.put("blog", "**.**.com");
以下代码:
public static > A max(Collectionxs) {
Iterator xi =xs.iterator();
A w=xi.next();while(xi.hasNext()) {
A x=xi.next();if (w.compareTo(x) < 0)
w=x;
}returnw;
}
类型擦除后会变成:
public staticComparable max(Collection xs){
Iterator xi=xs.iterator();
Comparable w=(Comparable)xi.next();while(xi.hasNext())
{
Comparable x=(Comparable)xi.next();if(w.compareTo(x) < 0)
w=x;
}returnw;
}
虚拟机中没有泛型,只有普通类和普通方法,所有泛型类的类型参数在编译时都会被擦除,泛型类并没有自己独有的Class类对象。比如并不存在List.class或是List.class,而只有 List.class。
03 自动装箱与拆箱
自动装箱就是 Java 自动将原始类型值转换成对应的对象,比如将 int 的变量转换成 Integer 对象,这个过程叫做装箱,反之将 Integer 对象转换成 int 类型值,这个过程叫做拆箱。
原始类型 byte, short, char, int, long, float, double 和 boolean 对应的封装类为 Byte, Short, Character, Integer, Long, Float, Double, Boolean。
先来看个自动装箱的代码:
int i = 10;
Integer n= i;
反编译后代码如下:
int i = 10;
Integer n= Integer.valueOf(i);
再来看个自动拆箱的代码:
Integer i = 10;int n = i;
反编译后代码如下:
Integer i = Integer.valueOf(10);int n = i.intValue();
从反编译得到内容可以看出,在装箱的时候自动调用的是 Integer的valueOf(int)方法。而在拆箱的时候自动调用的是 Integer 的 intValue 方法。
所以,装箱过程是通过调用包装器的 valueOf 方法实现的,而拆箱过程是通过调用包装器的 xxxValue 方法实现的。
04方法变长参数
可变参数(variable arguments)是在 Java 1.5 中引入的一个特性。它允许一个方法把任意数量的值作为参数。
看下以下可变参数代码,其中 print 方法接收可变参数:
public static voidmain(String[] args)
{
print("xuexue", "caiji", "NoOffer", "e");
}public static voidprint(String... strs)
{for (int i = 0; i < strs.length; i++)
{
System.out.println(strs[i]);
}
}
反编译后代码:
public static voidmain(String args[])
{
print(newString[] {
"xuexue", "caiji", "NoOffer", "e"});
}public static transient voidprint(String strs[])
{for(int i = 0; i < strs.length; i++)
System.out.println(strs[i]);
}
从反编译后代码可以看出,可变参数在被使用的时候,他首先会创建一个数组,数组的长度就是调用该方法是传递的实参的个数,然后再把参数值全部放到这个数组当中,然后再把这个数组作为参数传递到被调用的方法中。
05 方法变长参数
Java SE5 提供了一种新的类型 -Java 的枚举类型,关键字 enum 可以将一组具名的值的有限集合创建为一种新的类型,而这些具名的值可以作为常规的程序组件使用,这是一种非常有用的功能。
要想看源码,首先得有一个类吧,那么枚举类型到底是什么类呢?是 enum 吗?答案很明显不是,enum 就和 class 一样,只是一个关键字,他并不是一个类。那么枚举是由什么类维护的呢,我们简单的写一个枚举:
public enumt {
SPRING,SUMMER;
}
然后我们使用反编译,看看这段代码到底是怎么实现的,反编译后代码内容如下:
public final class T extendsEnum
{private T(String s, inti)
{super(s, i);
}public staticT[] values()
{
T at[];inti;
T at1[];
System.arraycopy(at= ENUM$VALUES, 0, at1 = new T[i = at.length], 0, i);returnat1;
}public staticT valueOf(String s)
{return (T)Enum.valueOf(demo/T, s);
}public static finalT SPRING;public static finalT SUMMER;private static finalT ENUM$VALUES[];static{
SPRING= new T("SPRING", 0);
SUMMER= new T("SUMMER", 1);
ENUM$VALUES= (newT[] {
SPRING, SUMMER
});
}
}
通过反编译后代码我们可以看到,public final class T extends Enum,说明,该类是继承了 Enum 类的,同时 final 关键字告诉我们,这个类也是不能被继承的。
当我们使用 enmu 来定义一个枚举类型的时候,编译器会自动帮我们创建一个 final 类型的类继承 Enum 类,所以枚举类型不能被继承。
06 内部类
内部类又称为嵌套类,可以把内部类理解为外部类的一个普通成员。
内部类之所以也是语法糖,是因为它仅仅是一个编译时的概念。
outer.java 里面定义了一个内部类 inner,一旦编译成功,就会生成两个完全不同的.class 文件了,分别是 outer.class 和 outer$inner.class。所以内部类的名字完全可以和它的外部类名字相同。
public classOutterClass {privateString userName;publicString getUserName() {returnuserName;
}public voidsetUserName(String userName) {this.userName =userName;
}classInnerClass{privateString name;publicString getName() {returnname;
}public voidsetName(String name) {this.name =name;
}
}
}
以上代码编译后会生成两个 class文件:OutterClass$InnerClass.class 、OutterClass.class 。
当我们尝试使用 jad 对 OutterClass.class 文件进行反编译的时候,命令行会打印以下内容:
Parsing OutterClass.class...
Parsing inner class OutterClass$InnerClass.class...
Generating OutterClass.jad
他会把两个文件全部进行反编译,然后一起生成一个 OutterClass.jad 文件。文件内容如下:
public classOutterClass
{classInnerClass
{publicString getName()
{returnname;
}public voidsetName(String name)
{this.name =name;
}privateString name;final OutterClass this$0;
InnerClass()
{this.this$0 = OutterClass.this;super();
}
}publicOutterClass()
{
}publicString getUserName()
{returnuserName;
}public voidsetUserName(String userName){this.userName =userName;
}privateString userName;
}
07 条件编译
—般情况下,程序中的每一行代码都要参加编译。但有时候出于对程序代码优化的考虑,希望只对其中一部分内容进行编译,此时就需要在程序中加上条件,让编译器只对满足条件的代码进行编译,将不满足条件的代码舍弃,这就是条件编译。
如在 C或 CPP 中,可以通过预处理语句来实现条件编译。其实在 Java 中也可实现条件编译。我们先来看一段代码:
public classConditionalCompilation {public static voidmain(String[] args) {final boolean DEBUG = true;if(DEBUG) {
System.out.println("Hello, DEBUG!");
}final boolean ONLINE = false;if(ONLINE){
System.out.println("Hello, ONLINE!");
}
}
}
反编译后代码如下:
public classConditionalCompilation
{publicConditionalCompilation()
{
}public static voidmain(String args[])
{boolean DEBUG = true;
System.out.println("Hello, DEBUG!");boolean ONLINE = false;
}
}
首先,我们发现,在反编译后的代码中没有 System.out.println("Hello, ONLINE!");,这其实就是条件编译。
当if(ONLINE)为 false 的时候,编译器就没有对其内的代码进行编译。
所以,Java 语法的条件编译,是通过判断条件为常量的if语句实现的。根据 if 判断条件的真假,编译器直接把分支为 false 的代码块消除。通过该方式实现的条件编译,必须在方法体内实现,而无法在正整个 Java 类的结构或者类的属性上进行条件编译。
这与 C/C++ 的条件编译相比,确实更有局限性。在 Java 语言设计之初并没有引入条件编译的功能,虽有局限,但是总比没有更强。
08 断言
在 Java 中,assert 关键字是从 JAVA SE 1.4 引入的,为了避免和老版本的 Java 代码中使用了 assert 关键字导致错误,Java 在执行的时候默认是不启动断言检查的(这个时候,所有的断言语句都将忽略!)。
如果要开启断言检查,则需要用开关 -enableassertions 或 -ea 来开启。
看一段包含断言的代码:
public classAssertTest {public static voidmain(String args[]) {int a = 1;int b = 1;assert a ==b;
System.out.println("xx");assert a != b : "yy";
}
反编译后代码如下:
public classAssertTest {publicAssertTest()
{
}public static voidmain(String args[])
{int a = 1;int b = 1;if(!$assertionsDisabled && a !=b)throw newAssertionError();
System.out.println("xx");if(!$assertionsDisabled && a ==b)
{throw new AssertionError("yy");
}else{
}static final boolean $assertionsDisabled = !AssertTest.desiredAssertionStatus();
}
很明显,反编译之后的代码要比我们自己的代码复杂的多。所以,使用了 assert 这个语法糖我们节省了很多代码。
其实断言的底层实现就是 if 语言,如果断言结果为 true,则什么都不做,程序继续执行,如果断言结果为 false,则程序抛出 AssertError 来打断程序的执行。
-enableassertions 会设置 $assertionsDisabled 字段的值。
09 数值字面量
在 java 7 中,数值字面量,不管是整数还是浮点数,都允许在数字之间插入任意多个下划线。这些下划线不会对字面量的数值产生影响,目的就是方便阅读。
int i =10_000;
System.out.println(i);
反编译后:
int i = 10000;
System.out.println(i);
反编译后就是把_删除了。也就是说编译器并不认识在数字字面量中的_,需要在编译阶段把他去掉。
10 for-each
增强 for 循环(for-each)相信大家都不陌生,日常开发经常会用到的,他会比 for 循环要少写很多代码,那么这个语法糖背后是如何实现的呢?
String[] strs = {"A", "B", "C"};for(String s : strs) {
System.out.println(s);
}
List strList = ImmutableList.of("A", "B", "C");for(String s : strList) {
System.out.println(s);
}
反编译后代码如下:
String strs[] = {"A", "B", "C"};
String args1[]=strs;int i =args1.length;for(int j = 0; j < i; j++)
{
String s=args1[j];
System.out.println(s);
}
List strList= ImmutableList.of("A", "B", "C");
String s;for(Iterator iterator =strList.iterator(); iterator.hasNext(); System.out.println(s))
s= (String)iterator.next();
代码很简单,for-each 的实现原理其实就是使用了普通的 for 循环和迭代器。
11 try-with-resource
Java 里,对于文件操作 IO 流、数据库连接等开销非常昂贵的资源,用完之后必须及时通过 close 方法将其关闭,否则资源会一直处于打开状态,可能会导致内存泄露等问题。
关闭资源的常用方式就是在finally块里是释放,即调用 close 方法。比如,我们经常会写这样的代码:
public static voidmain(String[] args) {
BufferedReader br= null;try{
String line;
br= new BufferedReader(new FileReader("A.xml"));while ((line = br.readLine()) != null) {
System.out.println(line);
}
}catch(IOException e) {//handle exception
} finally{try{if (br != null) {
br.close();
}
}catch(IOException ex) {//handle exception
}
}
}
从 Java 7 开始,jdk 提供了一种更好的方式关闭资源,使用 try-with-resources 语句,改写一下上面的代码,效果如下:
public static voidmain(String... args) {try (BufferedReader br = new BufferedReader(new FileReader("A.xml"))) {
String line;while ((line = br.readLine()) != null) {
System.out.println(line);
}
}catch(IOException e) {//handle exception
}
}
看,这简直是一大福音啊,虽然我之前一般使用 IOUtils 去关闭流,并不会使用在 finally 中写很多代码的方式,但是这种新的语法糖看上去好像优雅很多呢。
反编译以上代码,看下他的背后原理:
public static transient voidmain(String args[])
{
BufferedReader br;
Throwable throwable;
br= new BufferedReader(new FileReader("A.xml"));
throwable= null;
String line;try{while((line = br.readLine()) != null)
System.out.println(line);
}catch(Throwable throwable2)
{
throwable=throwable2;throwthrowable2;
}if(br != null)if(throwable != null)try{
br.close();
}catch(Throwable throwable1)
{
throwable.addSuppressed(throwable1);
}elsebr.close();breakMISSING_BLOCK_LABEL_113;
Exception exception;
exception;if(br != null)if(throwable != null)try{
br.close();
}catch(Throwable throwable3)
{
throwable.addSuppressed(throwable3);
}elsebr.close();throwexception;
IOException ioexception;
ioexception;
}
}
其实背后的原理也很简单,那些我们没有做的关闭资源的操作,编译器都帮我们做了。
所以,再次印证了,语法糖的作用就是方便程序员的使用,但最终还是要转成编译器认识的语言。
12 lambda表达式
关于 lambda 表达式,有人可能会有质疑,因为网上有人说他并不是语法糖。其实我想纠正下这个说法。
Labmda 表达式不是匿名内部类的语法糖,但是他也是一个语法糖。实现方式其实是依赖了几个JVM底层提供的 lambda 相关 api。
先来看一个简单的 lambda 表达式。遍历一个list:
List strList = ImmutableList.of("A", "B", "C");
strList.forEach( s-> { System.out.println(s); } );
为啥说他并不是内部类的语法糖呢,前面讲内部类我们说过,内部类在编译之后会有两个 class 文件,但是,包含 lambda 表达式的类编译后只有一个文件。
反编译后代码如下:
ImmutableList strList = ImmutableList.of((Object)"A", (Object)"B", (Object)"C");
strList.forEach((Consumer)LambdaMetafactory.metafactory(null, null, null, (Ljava/lang/Object;)V, lambda$main$0(java.lang.String ), (Ljava/lang/String;)V)());
private static void lambda$main$0(String s) {
System.out.println(s);
}
可以看到,在 forEach 方法中,其实是调用了java.lang.invoke.LambdaMetafactory#metafactory 方法,该方法的第四个参数 implMethod 指定了方法实现。可以看到这里其实是调用了一个 lambda$main$0 方法进行了输出。
再来看一个稍微复杂一点的,先对 List 进行过滤,然后再输出:
public static voidmain(String... args) {
List strList = ImmutableList.of("A", "B", "C");
List HollisList= strList.stream().filter(string -> string.contains("A")).collect(Collectors.toList());
HollisList.forEach( s->{ System.out.println(s); } );
}
反编译后代码如下
public static voidmain(String ... args) {
ImmutableList strList= ImmutableList.of((Object)"A", (Object)"B", (Object)"C");
List HollisList = strList.stream().filter((Predicate)LambdaMetafactory.metafactory(null, null, null, (Ljava/lang/Object;)Z, lambda$main$0(java.lang.String ), (Ljava/lang/String;)Z)()).collect(Collectors.toList());
HollisList.forEach((Consumer)LambdaMetafactory.metafactory(null, null, null, (Ljava/lang/Object;)V, lambda$main$1(java.lang.Object ), (Ljava/lang/Object;)V)());
}private static void lambda$main$1(Object s) {
System.out.println(s);
}private static boolean lambda$main$0(String string) {return string.contains("A");
}
两个 lambda 表达式分别调用了 lambda$main$1和lambda$main$0 两个方法。
所以,lambda 表达式的实现其实是依赖了一些底层的 api,在编译阶段,编译器会把 lambda 表达式进行解糖,转换成调用内部 api 的方式。
可能遇到的坑
泛型——当泛型遇到重载
public static void method(Listlist) {
System.out.println("invoke method(List list)");
}public static void method(Listlist) {
System.out.println("invoke method(List list)");
}
上面这段代码,有两个重载的函数,因为他们的参数类型不同,一个是 List 另一个是 List,但是,这段代码是编译通不过的。因为我们前面讲过,参数 List和 List 编译之后都被擦除了,变成了一样的原生类型 List,擦除动作导致这两个方法的特征签名变得一模一样。
泛型——当泛型遇到重catch
泛型的类型参数不能用在 Java 异常处理的 catch 语句中。因为异常处理是由 JVM 在运行时刻来进行的。由于类型信息被擦除,JVM 是无法区分两个异常类型 MyException 和 MyException 的。
泛型——当泛型内包含静态变量
public classStaticTest{public static voidmain(String[] args){
GT gti = new GT();
gti.var=1;
GT gts = new GT();
gts.var=2;
System.out.println(gti.var);
}
}class GT{public static int var=0;public voidnothing(T x){}
}
以上代码输出结果为:2!由于经过类型擦除,所有的泛型类实例都关联到同一份字节码上,泛型类的所有静态变量是共享的。
自动装箱与拆箱——对象相等比较
public static voidmain(String[] args) {
Integer a= 1000;
Integer b= 1000;
Integer c= 100;
Integer d= 100;
System.out.println("a == b is " + (a ==b));
System.out.println(("c == d is " + (c ==d)));
}
//输出结果
a == b is false
c == d is true
在 Java 5 中,在 Integer 的操作上引入了一个新功能来节省内存和提高性能。整型对象通过使用相同的对象引用实现了缓存和重用。
适用于整数值区间-128 至 +127。
只适用于自动装箱。使用构造函数创建对象不适用。
增强 for 循环
for(Student stu : students) {if (stu.getId() == 2)
students.remove(stu);
}
会抛出 ConcurrentModificationException 异常。
Iterator 是工作在一个独立的线程中,并且拥有一个 mutex(互斥) 锁。Iterator 被创建之后会建立一个指向原来对象的单链索引表,当原来的对象数量发生变化时,这个索引表的内容不会同步改变,所以当索引指针往后移动的时候就找不到要迭代的对象,所以按照 fail-fast 原则 Iterator 会马上抛出java.util.ConcurrentModificationException 异常。
所以 Iterator 在工作的时候是不允许被迭代的对象被改变的。但你可以使用 Iterator 本身的方法 remove()来删除对象,Iterator.remove() 方法会在删除当前迭代对象的同时维护索引的一致性。