前言

作为一名 Java 从业者,虽然近几年,无论是使用规模、开发者人数,还是技术生态成熟度、相关工具的丰富程度,Java 都在后端开发语言中有着不可撼动的地位,也是开发各类业务系统的首选语言。

而且薪资也非常可观

java架构 java架构师面试_面试

 

但很多同学却总有种“做不动”的感觉。项目还好说,用 Java 写系统代码都没有问题,可一旦有人问到 Java 程序运行起来以后内部发生了什么,怎么让它运行的更好?大多数同学就可能答不上来了。

而现在面试 Java 岗位,无论什么规模的公司,面试官必问到 JVM 相关的问题,什么线程、内存模型、JVM 运行时内存、垃圾回收与算法、GC 垃圾收集器、JAVA IO/NIO 、JVM 类加载机制等等知识点。

在面试中,这些问题如果答不好,可能直接影响你的薪资。

这里和大家分享一张 JVM 和性能优化大图,包含了 Java 工程师一定要花时间学会的 Java 内存区域、垃圾回收器和内存分配策略、JVM 的执行子系统、编写高效优雅 Java 程序、性能优化等等知识点。(感兴趣的同学可以关注小编+私信【电子书】领取高清完整版图谱)

java架构 java架构师面试_架构_02

 

接下来就带大家详细了解一下,2021 年一线大厂技术面试 JVM 知识的必考问题,看看你能答出几道?

什么情况下会发生栈内存溢出。

详解JVM内存模型

JVM内存为什么要分成新生代,老年代,持久代。新生代中为什么要分为Eden和Survivor。

JVM中一次完整的GC流程是怎样的,对象如何晋升到老年代

你知道哪几种垃圾收集器,各自的优缺点,重点讲下cms和G1,包括原理,流程,优缺点。

说一说 JVM 运行时数据区?

GC 收集器有哪些?CMS 收集器与 G1 收集器的特点?

如何判断 Java 对象已经被回收?

垃圾回收算法有哪些?

堆和栈的区别是什么?

一什么情况下会发生栈内存溢出。

路思: 描述栈定义,再描述为什么会溢出,再说明一下相关配置参数,OK的话可以给面试官手写是一个栈溢出的demo。

我的答案:

  • 栈是线程私有的,他的生命周期与线程相同,每个方法在执行的时候都会创建一个栈帧,用存储局部变量表,操作数栈,动态链接,方法出口等信息。局部变量表又包含基本数据类型,对象引用类型
  • 如果线程请求的栈深度大于虚拟机所允许的最大深度,将抛出StackOverflowError异常,方递
  • 归调用产生这种结果。
  • 如果Java虚拟机栈可以动态扩展,并且扩展的动作已经尝试过,但是无法申请到足够的内去完成扩展,或者在新建立线程的时候没有足够的内存去创建对应的虚拟机栈,那么Java虚拟机将抛出一个OutOfMemory 异常。(线程启动过多)
  • 参数 -Xss 去调整JVM栈的大小

二详解JVM内存模型

思路: 给面试官画一下JVM内存模型图,并描述每个模块的定义,作用,以及可能会存在的题,如栈溢出等。

我的答案:

JVM内存结构

java架构 java架构师面试_架构_03

程序计数器:当前线程所执行的字节码的行号指示器,用于记录正在执行的虚拟机字节指令地址,线程私有。

Java虚拟栈:存放基本数据类型、对象的引用、方法出口等,线程私有。

Native方法栈:和虚拟栈相似,只不过它服务于Native方法,线程私有。

Java堆:java内存最大的一块,所有对象实例、数组都存放在java堆,GC回收的地方,线程共享。

方法区:存放已被加载的类信息、常量、静态变量、即时编译器编译后的代码数据等。(即永久带),回收目标主要是常量池的回收和类型的卸载,各线程共享

三JVM内存为什么要分成新生代,老年代,持久代。新生代中为什么要分为Eden和Survivor。

思路: 先讲一下JAVA堆,新生代的划分,再谈谈它们之间的转化,相互之间一些参数的配(如: –XX:NewRatio,–XX:SurvivorRatio等),再解释为什么要这样划分,最好加一点自己的理解。

我的答案:

1)共享内存区划分

  • 共享内存区 = 持久带 + 堆
  • 持久带 = 方法区 + 其他
  • Java堆 = 老年代 + 新生代
  • 新生代 = Eden + S0 + S1

2)一些参数的配置

  • 默认的,新生代 ( Young ) 与老年代 ( Old ) 的比例的值为 1:2 ,可以通过参数 –XX:NewRatio 配置。
  • 默认的,Edem : from : to = 8 : 1 : 1 ( 可以通过参数 –XX:SurvivorRatio 来设定)
  • Survivor区中的对象被复制次数为15(对应虚拟机参数 -XX:+MaxTenuringThreshold)

3)为什么要分为Eden和Survivor?为什么要设置两个Survivor区?

  • 如果没有Survivor,Eden区每进行一次Minor GC,存活的对象就会被送到老年代。老年代很快被填满,触发Major GC.老年代的内存空间远大于新生代,进行一次Full GC消耗的时间比Minor GC长得多,所以需要分为Eden和Survivor。
  • Survivor的存在意义,就是减少被送到老年代的对象,进而减少Full GC的发生,Survivor的预筛选保证,只有经历16次Minor GC还能在新生代中存活的对象,才会被送到老年代。
  • 设置两个Survivor区最大的好处就是解决了碎片化,刚刚新建的对象在Eden中,经历一次MinorGC,Eden中的存活对象就会被移动到第一块survivor space S0,Eden被清空;等Eden区再满了,就再触发一次Minor GC,Eden和S0中的存活对象又会被复制送入第二块survivor spaceS1(这个过程非常重要,因为这种复制算法保证了S1中来自S0和Eden两部分的存活对象占用连续的内存空间,避免了碎片化的发生)

四说一说 JVM 运行时数据区?

不同虚拟机的运行时数据区可能略微有所不同,但都会遵从 Java 虚拟机规范, Java 虚拟机规范规定的区域分为以下 5 个部分:

程序计数器

当前线程所执行的字节码的行号指示器,字节码解析器的工作是通过改变这个计数器的值,来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等基础功能;

Java 虚拟机栈

用于存储局部变量表、操作数栈、动态链接、方法出口等信息;

本地方法栈

与虚拟机栈的作用是一样的,只不过虚拟机栈是服务 Java 方法的,而本地方法栈是为虚拟机调用 Native 方法服务的;

Java 堆

Java 虚拟机中内存最大的一块,是被所有线程共享的,几乎所有的对象实例都在这里分配内存;

方法区

用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译后的代码等数据。

五、GC 收集器有哪些?

并行收集器:串行收集器使用一个单独的线程进行收集,GC 时服务有停顿时间。

串行收集器:次要回收中使用多线程来执行。

CMS 收集器是基于“标记—清除”算法实现的,经过多次标记才会被清除。

G1 从整体来看是基于“标记—整理”算法实现的收集器,从局部(两个 Region 之间)上来看是基于“复制”算法实现的。

六、如何判断 Java 对象已经被回收?

1、引用计数算法

为每个对象创建一个引用计数,有对象引用时计数器 +1,引用被释放时计数 -1,当计数器为 0 时就可以被回收。它有一个缺点不能解决循环引用的问题;

2、可达性分析法

从 GC Roots 开始向下搜索,搜索所走过的路径称为引用链。当一个对象到 GC Roots 没有任何引用链相连时,则证明此对象是可以被回收的。

GC Roots:

1.虚拟机栈(本地变量表)引用的对象。

2.方法区静态属性引用的对象。

3.方法区常量引用的对象。

4.本地方法栈JNI(一般指naive方法)中引用的对象

java架构 java架构师面试_开发语言_04

 

图示 Object6、7、8 与起始点没有任何引用链,则说明不可用,需要被回收。

七、垃圾回收算法有哪些?

1、标记-清除(Mark-Sweep)

此算法执行分两阶段。第一阶段从引用根节点开始标记所有被引用的对象,第二阶段遍历整个堆,把未标记的对象清除。此算法需要暂停整个应用, 同时,会产生内存碎片。

java架构 java架构师面试_面试_05

 

2、复制(Copying)

此算法把内存空间划为两个相等的区域,每次只使用其中一个区域。垃圾回收时,遍历当前使用区域,把正在使用中的对象复制到另外一个区域中。

每次只处理正在使用中的对象,因此复制成本比较小,同时复制过去以后还能进行相应的内存整理,不会出现“碎片”问题。当然,缺点也是很明显的,需要两倍内存间。

java架构 java架构师面试_java_06

 

3、标记-整理(Mark-Compact)

结合了前两个算法的优点,也是分两阶段,第一阶段从根节点开始标记所有被引用对象,第二阶段遍历整个堆,清除标记对象,并未标记对象并且把存活对象“压缩”到堆的其中一块,按顺序排放。

此算法避免了“标记-清除”的碎片问题,同时也避免了“复制”算法的空间问题。

java架构 java架构师面试_面试_07

 

总结

以上资料均出自阿里P8架构师,整理的《2021Java技术栈面试总结合集》