对象的创建

我们知道JAVA是面向对象的,在语言层面上,创建对象通过一个关键字new就可以完成。

在虚拟机中,创建一个普通对象的过程就比较复杂:

  • 虚拟机遇到一条new指令
  • 首先去检查这个指令的参数是否能在常量池中定位到一个类的符号引用1
  • 检查这个符号引用代表的类是否已被加载、解析和初始化过
  • 若没有,先执行相应的类加载过程;
  • 类加载检查通过后,虚拟机为新生对象进行内存的分配2,对象所需内存的大小在类加载完成后便可完全确定;
  • 内存分配完成后,虚拟机需要将分配到的内存空间都初始化为零值(不包括对象头3);
  • 虚拟机要对对象进行必要的设置(例如该对象是哪个类的实例、如何找到类的元数据信息、对象的哈希码等)。这些信息都存放在对象的对象头中(如此看来,对象头很重要啊)。

上面的工作完成后,从虚拟机视角看,一个新的对象已经产生,但从Java程序视角来看,对象创建才刚刚开始————< init>方法4还没有执行,所以的字段都还是零。一般来说执行new指令后会接着执行<
init>方法,把对象按照程序员的意愿进行初始化,这样一个真正可用的对象才算完全产生出来。


对象的内存布局

在HotSpot虚拟机里,对象在内存中的存储布局分为三部分:

  • 对象头(Header) 包括两部分信息:
  • 1.用于存储对象自身的运行时数据(官方称为“Mark Word”);
  • 2.类型指针。
    这些信息是对对象的附加说明标志的信息,与对象的自身定义的数据无关,就如我们的快递单和实际快递实物没有实际关系一样。
  • 实例数据(Instance Data) 就是对象真正存储的有效信息。
  • 对齐填充(Padding) 仅仅起着占位符的作用。

图解:

JVM:HotSpot虚拟机----对象的创建简单介绍及对象内存布局详解_Word


(图片来源:JVM(三)JVM中对象的内存布局详解)

JVM:HotSpot虚拟机----对象的创建简单介绍及对象内存布局详解_数据_02


(图片来源:java虚拟机对象内存分布详解)

一、对象头

我们知道对象头包含两部分

  • 用于存储对象自身的运行时数据(“Mark Word”):对象头信息是相对于对象自身定义数据无关的额外存储信息。所以为了充分利用这部分的空间,根据对象不同的状态将这部分存储不同的信息。

表1:HotSpot虚拟机对象头 Mark Word

存储内容

标志位

状态

对象哈希码、对象分代年龄

010

未锁定

指向锁记录的指针

00

轻量级锁定

指向重量级锁的指针

10

膨胀(重量级锁定)

空,不需要记录信息

11

GC标记

偏向线程ID、偏向时间戳、对象的分代年龄

101

可偏向

例如:在32位HotSpot虚拟机中,如果对象处于未被锁定的状态下,那么Mark Word的32bit空间中的25bit用于存储对象哈希码,4bit用于存储对象分代年龄,2bit用于存储锁标志位,1bit固定为0。下表是不同状态下对象存储内容的详细表:

下表为32位Mark Word的详细分布:

JVM:HotSpot虚拟机----对象的创建简单介绍及对象内存布局详解_字段_03


(图片来源:java虚拟机对象内存分布详解)

要理解上图,我们需要知道什么是GC标记,即垃圾回收算法。这里的介绍比较不错 还需要知道锁的概念,对象锁

在多线程的情况下,锁在线程安全中扮演着举重轻重的作用。可以参考:浅谈偏向锁、轻量级锁、重量级锁

  • 类型指针
    类型指针即对象指向它的类元数据的指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。
    但这个又不是必须的, 这就牵扯到对象的访问方式问题了,如果使用直接指针访问方式,需要用到;若是使用句柄访问,因为句柄中包含了对象实例数据与类型数据各自的具体地址信息,所以就用不到类型指针了。
  • 如果对象是一个Java数组对象头中还必须有一块用于记录数组长度的数据,因为虚拟机无法从数组的元数据中确定数组的大小

二、实例数据

实例数据部分是对象真正存储的有效信息,也既是我们在程序代码里面所定义的各种类型的字段内容,无论是从父类继承下来的,还是在子类中定义的都需要记录下来。

这部分的存储顺序会受到虚拟机分配策略参数(FieldsAllocationStyle)和字段在Java源码中定义顺序的影响。

HotSpot虚拟机默认的分配策略为longs/doubles、ints、shorts/chars、bytes/booleans、oops(Ordinary Object Pointers),从分配策略中可以看出,相同宽度的字段总是被分配到一起。在满足这个前提条件的情况下,在父类中定义的变量会出现在子类之前。如果 CompactFields参数值为true(默认为true),那子类之中较窄的变量也可能会插入到父类变量的空隙之中。

基本规则:

1.存储顺序见下表:默认基本类型在前,按长度由长至短存储,然后就是对象指针引用。相同宽度的字段分配到一起。如果设置了-XX:FieldsAllocatinotallow=0(默认是1),那么引用就会放在最前面。
2.对于同宽度的字段,父类在前子类在后。如果开启CompactFields,那么,子类中较窄的变量就会插到父列的变量的空隙中。

如图:

JVM:HotSpot虚拟机----对象的创建简单介绍及对象内存布局详解_字段_04

三、对齐填充

对齐填充并不是必然存在的,也没有特别的含义,它仅仅起着占位符的作用。由于HotSpot VM的自动内存管理系统要求对象起始地址必须是8字节的整数倍,换句话说就是对象的大小必须是8字节的整数倍。对象头正好是8字节的倍数(1倍或者2倍),因此当对象实例数据部分没有对齐的话,就需要通过对齐填充来补全。

该博客下有一个例子:

32 位系统下,当使用 new Object() 时,JVM 将会分配 8(Mark Word+类型指针) 字节的空间,128 个 Object 对象将占用 1KB 的空间。如果是 new Integer(),那么对象里还有一个 int 值,其占用 4 字节,这个对象也就是 8+4=12 字节,对齐后,该对象就是 16 字节。

以上只是一些简单的对象,那么对象的内部属性是怎么排布的?

Class A {
    int i;
    byte b;
    String str;
}

其中对象头部占用 ‘Mark Word’4 + ‘类型指针’4 = 8 字节;byte 8 位长,占用 1 字节;int 32 位长,占用 4 字节;String 只有引用,占用 4 字节;那么对象 A 一共占用了 8+1+4+4=17 字节,按照 8 字节对齐原则,对象大小也就是 24 字节。

这个计算看起来是没有问题的,对象的大小也确实是 24 字节,但是对齐(padding)的位置并不对:在 HotSpot VM
中,对象排布时,间隙是在 4 字节基础上的(在 32 位和 64 位压缩模式下)。上述例子中,int 后面的 byte,空隙只剩下 3
字节,接下来的 String 对象引用需要 4 字节来存放,因此 byte 和对象引用之间就会有 3 字节对齐,对象引用排布后,最后会有 4
字节对齐,因此结果上依然是 7 字节对齐。

此时对象的结构示意图,如下图所示:

JVM:HotSpot虚拟机----对象的创建简单介绍及对象内存布局详解_Word_05


  1. 例如我们定义一个名字为student的class类 ,student就是该类的一个符号引用。 ↩︎
  2. 为对象分配空间的任务等同于把一块确定大小的内存从Java堆中划分出来。 ↩︎
  3. 对象头会在内存布局中详讲。 ↩︎
  4. init方法是类中的一个特殊的对象方法,专门用来对象创建的对象进行初始化。
    当通过类创建对象的时候,系统就会自动调用init方法。 ↩︎