本文阐述了JVM的构成和组件,配图清晰易懂,是学习Java开发者的入门必读文章。

每个Java开发人员都知道字节码经由JRE(Java运行时环境)执行。但他们或许不知道JRE其实是由Java虚拟机(JVM)实现,JVM分析字节码,解释并执行它。作为开发人员,了解JVM的架构是非常重要的,因为它使我们能够编写出更高效的代码。本文中,我们将深入了解Java中的JVM架构和JVM的各个组件。

JVM

虚拟机是物理机的软件实现。Java的设计理念是WORA(Write Once Run Anywhere,一次编写随处运行)。编译器将Java文件编译为Java .class文件,然后将.class文件输入到JVM中,JVM执行类文件的加载和执行的操作。请看以下的JVM架构图:

java 站结构使用 java 构架_jvm

 

 

JVM是如何工作的?

如上面架构图所示,JVM分为三个主要子系统:

  • 类加载器子系统(Class Loader Subsystem)
  • 运行时数据区(Runtime Data Area)
  • 执行引擎(Execution Engine)

1. 类加载器子系统

Java的动态类加载功能由类加载器子系统处理,处理过程包括加载和链接,并在类文件运行时,首次引用类时就开始实例化类文件,而不是在编译时进行。

1.1 加载

Boot Strap类加载器,Extension类加载器和Application(类加载器是实现类加载过程的三个类加载器。

(1) Boot Strap类加载器:负责从引导类路径加载类,除了rt.jar,它具有最高优先级;

(2) Extension 类加载器:负责加载ext文件夹(jre lib)中的类;

(3) Application类加载器:负责加载应用程序级类路径,环境变量中指定的路径等信息。

上面的类装载器在加载类文件时遵循委托层次算法(Delegation Hierarchy Algorithm)。

1.2 链接

(1) 验证(Verify):字节码验证器将验证生成的字节码是否正确,如果验证失败,将提示验证错误;

(2) 准备(Prepare):对于所有静态变量,内存将会以默认值进行分配;

(3) 解释(Resolve):有符号存储器引用都将替换为来自方法区(Method Area)的原始引用。

1.3 初始化

这是类加载的最后阶段,所有的静态变量都将被赋予原始值,并且静态区块将被执行。

2. 运行时数据区

运行时数据区可分为5个主要组件:

(1) 方法区(Method Area):所有的类级数据将存储在这里,包括静态变量。每个JVM只有一个方法区,它是一个共享资源;

Java虚拟机具有在所有Java虚拟机线程之间共享的方法区域。该方法区域类似于常规语言的编译代码的存储区域,或者类似于操作系统过程中的“文本”段。它存储每个类的结构,例如运行时常量池,字段和方法数据,以及方法和构造函数的代码,包括用于类和实例初始化以及接口初始化的特殊方法。

方法区域是在虚拟机启动时创建的。尽管方法区域在逻辑上是堆的一部分,但是简单的实现可以选择不进行垃圾回收或压缩。该规范没有规定方法区域的位置或用于管理已编译代码的策略。方法区域可以是固定大小的,或者可以根据计算的需要进行扩展,如果不需要更大的方法区域,则可以缩小。方法区域的内存不必是连续的。

Java虚拟机实现可以为程序员或用户提供对方法区域初始大小的控制,以及在方法区域大小可变的情况下,可以控制最大和最小方法区域大小。

以下异常条件与方法区域相关联:

如果无法提供方法区域中的内存来满足分配请求,则Java虚拟机将抛出一个OutOfMemoryError

方法区在jdk1.6/1.8版本之间的实现差异:


java 站结构使用 java 构架_java_02

方法区在jdk1.6/1.8版本之间的实现差异

 

(2) 堆区域(Heap Area):所有对象及其对应的实例变量和数组将存储在这里。每个JVM也只有一个堆区域。由于方法和堆区域共享多个线程的内存,所存储的数据不是线程安全的;

(3) 堆栈区(Stack Area):对于每个线程,将创建单独的运行时堆栈。对于每个方法调用,将在堆栈存储器中产生一个条目,称为堆栈帧。所有局部变量将在堆栈内存中创建。堆栈区域是线程安全的,因为它不共享资源。


java 站结构使用 java 构架_Java_03

栈区域结构示意图

java 站结构使用 java 构架_jvm_04

堆栈框架分为三个子元素:

  • 局部变量数组(Local Variable Array):与方法相关,涉及局部变量,并在此存储相应的值
  • 操作数堆栈(Operand stack):如果需要执行任何中间操作,操作数堆栈将充当运行时工作空间来执行操作
  • 帧数据(Frame Data):对应于方法的所有符号存储在此处。在任何异常的情况下,捕获的区块信息将被保持在帧数据中;

其他:

一般在使用递归、及循环引用容易导致栈内存溢出,因此在编程的逻辑中应避免无限制的递归及无终止的循环依赖等逻辑。

 

(4) PC寄存器(PC Registers):每个线程都有单独的PC寄存器,用于保存当前执行指令的地址。一旦执行指令,PC寄存器将被下一条指令更新;

(5) 本地方法堆栈(Native Method stacks):本地方法堆栈保存本地方法信息。对于每个线程,将创建一个单独的本地方法堆栈。

3.执行引擎

分配给运行时数据区的字节码将由执行引擎执行,执行引擎读取字节码并逐个执行。

(1) 解释器:解释器更快地解释字节码,但执行缓慢。解释器的缺点是当一个方法被调用多次时,每次都需要一个新的解释;

(2) JIT编译器:JIT编译器消除了解释器的缺点。执行引擎将在转换字节码时使用解释器的帮助,但是当它发现重复的代码时,将使用JIT编译器,它编译整个字节码并将其更改为本地代码。这个本地代码将直接用于重复的方法调用,这提高了系统的性能。JIT的构成组件为:

  • 中间代码生成器(Intermediate Code Generator):生成中间代码
  • 代码优化器(Code Optimizer):负责优化上面生成的中间代码
  • 目标代码生成器(Target Code Generator):负责生成机器代码或本地代码
  • 分析器(Profiler):一个特殊组件,负责查找热点,即该方法是否被多次调用;

(3) 垃圾收集器(Garbage Collector):收集和删除未引用的对象。可以通过调用“System.gc()”触发垃圾收集,但不能保证执行。JVM的垃圾回收对象是已创建的对象。

(4) Java本机接口(JNI):JNI将与本机方法库进行交互,并提供执行引擎所需的本机库。

(5) 本地方法库(Native Method Libraries):它是执行引擎所需的本机库的集合。