JVM虚拟机-运行时数据区概述

运行时数据区域

总览

JDK. 1.7 之后版本略有不同

Java 虚拟机在执行 Java 程序的过程中会把它管理的内存划分成若干个不同的数据区域。

有必要深入了解这块的内容,因为它将决定服务器性能,除此之外还有助于快速定位虚拟机的相关Error。

首先来对整个运行时区域有一个整体的认识。

如下图

JDK 1.7 之前:

image-20210507090340086

JDK 1.7 以及之后(1.8正式使用,1.7还需要手动设置一下) :

image-20210507091500982

  • 线程私有的(图中红色)

  • 线程共享的(图中绿色、蓝色)

概念扫盲

什么是栈帧(Stack Frame)

每一次函数的调用,都会在调用栈上维护一个独立的栈帧,每个独立的栈帧一般包括:

  • 函数的返回地址和参数
  • 临时变量
  • 函数调用的上下文

栈是从高地址向低地址延伸,一个函数的栈帧用ebpesp 这两个寄存器来划定范围。

ebp 指向当前的栈帧的底部,esp 始终指向栈帧的顶部。

  • ebp 寄存器又被称为帧指针(Frame Pointer)
  • esp 寄存器又被称为栈指针(Stack Pointer)

JVM常见出现两种错误

  • StackOverFlowError 若 Java 虚拟机栈的内存大小不允许动态扩展,那么当线程请求栈的深度超过当前 Java 虚拟机栈的最大深度的时候,就抛出 StackOverFlowError 错误。
  • OutOfMemoryError Java 虚拟机栈的内存大小可以动态扩展, 如果虚拟机在动态扩展栈时无法申请到足够的内存空间,则抛出OutOfMemoryError异常异常。

程序计数器

程序计数器占用较小的一块内存空间,每条线程都需要有一个独立的程序计数器,程序计数器用于记录当前线程执行的位置,从而当线程被来回切换的时候,能够知道该线程上次运行到哪儿了。

字节码解释器工作时通过改变这个计数器的值,来选取下一条需要执行的字节码指令,从而实现代码的流程控制,如:顺序执行、选择、循环、异常处理。

它的生命周期随着线程的创建而创建,随着线程的结束而死亡。

程序计数器是唯一一个不会出现 OutOfMemoryError 的内存区域。

虚拟机栈

结构

虚拟机栈也是线程私有,而且生命周期与线程相同。

每个Java方法在执行的时候都会创建一个栈帧,用于存储局部变量表、操作数栈、动态链接、方法出口等信息

image-20210507144625064

局部变量表

  • 存放编译器可知的各种基本数据类型(boolean、byte等)
  • 对象引用(reference类型,它不等同于对象本身)
    • 可能是一个指向对象起始地址的引用指针
    • 也可能是指向另一个代表对象的句柄
    • 其他次对象相关的位置
  • returnAddress类型,指向了一条字节码指令的地址

方法是如何调用的

每一次函数调用都会有一个对应的栈帧被压入 Java 栈,每一个函数调用结束后,都会有一个栈帧被弹出。

Java 方法有两种返回方式:

  1. return 语句。
  2. 抛出异常。

不管哪种返回方式都会导致栈帧被弹出。

本地方法栈

主要为虚拟机使用到的Native方法服务,作用其实类似虚拟机栈,其结构也和虚拟机栈一样

二者的区别是虚拟机栈为虚拟机执行字节码服务

本地方法被执行的时候,在本地方法栈也会创建一个栈帧,用于存放该本地方法的局部变量表、操作数栈、动态链接、出口信息。

方法执行完毕后相应的栈帧也会出栈并释放内存空间。

在 HotSpot 虚拟机中和虚拟机栈合二为一

Java 堆是所有线程共享的一块内存区域,在虚拟机启动时创建

此内存区域的目的是存放对象实例几乎所有的对象实例以及数组都在这里分配内存。

说是几乎是因为由于多项技术的进步与成熟,如:逃逸分析技术逐渐成熟,栈上分配、标量替换优化技术,一些对象也可能在栈上分配内存。

Java 堆是JVM中最大的一块内存区域,也是是垃圾回收(Garbage Collected)管理的主要区域,故又叫做GC堆

浅堆和深堆

浅堆和深堆是两个非常重要的概念,理解他们之前需要先了解什么是保留集。

保留集,即为单一对象所持有的对象的集合,如图:

image-20210507154003916

  • 浅堆是指一个对象所消耗的内存。如上图
  • 深堆是指对象的保留集中所有的对象浅堆大小之和

堆的细分

HotSpot中还有永久代的概念,不过已经是历史了。

JDK 8 HotSpot 的永久代被彻底移除,取而代之是元空间,元空间使用的是直接内存。

现在垃圾收集器基本都采用分代垃圾收集算法,所以 Java 堆还可以细分,堆分为新生代(占堆1/3),老生代(占堆2/3)

  • 新生代(内部比例8:1:1)
    • Eden 空间
    • From Survivor 空间
    • To Survivor 空间
  • 老年代

进一步划分的目的是更好地回收内存,或者更快地分配内存。

流程:

  • 大多数情况,对象都会首先在 Eden 区域分配
  • 在一次新生代垃圾回收后,如果对象还存活,则会进入两个Survivor中的一个,然后对象的年龄加 1
  • 它的年龄增加到年龄阈值(默认为 15 ),就会被晋升到老年代中

对象晋升到老年代的年龄阈值,可以通过参数 -XX:MaxTenuringThreshold 设置

方法区

方法区与 Java 堆一样,也是所有线程共享的。

主要用于存储类的信息、常量池、方法数据、方法代码等。

方法区逻辑上属于堆的一部分,但是为了与堆进行区分,有一个别名叫做 Non-Heap(非堆)

该区域的内存回收目标主要针对常量池的回收类型的卸载

在HotSpot虚拟机中,用永久代来实现方法区,但是这样容易遇到内存溢出的问题,所以在Java 8之后就取消了方法区。

方法区和永久代的关系

摘自《深入理解Java虚拟机》第三版

《Java 虚拟机规范》只是规定了有方法区这么个概念和它的作用,并没有规定如何去实现它。那么,在不同的 JVM 上方法区的实现肯定是不同的了。 方法区和永久代的关系很像 Java 中接口和类的关系,类实现了接口,而永久代就是 HotSpot 虚拟机对虚拟机规范中方法区的一种实现方式。 也就是说,永久代是 HotSpot 的概念,方法区是 Java 虚拟机规范中的定义,是一种规范,而永久代是一种实现,一个是标准一个是实现,其他的虚拟机实现并没有永久代这一说法。

为什么要将永久代替换为元空间 ?

  • 永久代内存有一个JVM固定的上限,经常会出现OutOfMemoryError
  • 元空间使用的是直接内存,受本机可用内存的限制,虽然元空间仍旧可能溢出,但是比原来出现的几率会更小。
  • 元空间里面存放的是类的元数据,由系统的实际可用空间来控制,这样能加载的类就变多了。
  • 在 JDK8,合并 HotSpot 和 JRockit 的代码时,JRockit 没有永久代,如果强行保留实现起来困难重重。

当元空间溢出时会得到如下错误: java.lang.OutOfMemoryError: MetaSpace

运行时常量池

运行时常量池用于存放编译期间生成的各种字面量符号引用,是方法区的一部分。

运行时常量池用来动态获取类信息,包括:

  • Class文件元信息描述
  • 编译后的代码数据
  • 引用类型数据
  • 类文件常量池

运行时常量池是在类加载完成之后,将每个Class常量池中的符号引用值转存到运行时常量池中。

每个Class都有一个运行时常量池,类在解析之后将符号引用替换成直接引用,与全局常量池中的引用值保持一致

运行时常量池相的另外一个重要特性是具备动态性,Java语言并不要求常量一定只有编译器才能产生,也就是并非预置入Class文件中的常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中。

直接内存

直接内存并不是虚拟机运行时数据区的一部分,也不是虚拟机规范中定义的内存区域,但是这部分内存也被频繁地使用。

使用的方式是通过 JDK1.4 中加入的NIO(New Input/Output)类,它可以直接使用 Native 函数库直接分配堆外内存

通过一个存储在 Java 堆中的 DirectByteBuffer 对象作为这块内存的引用进行操作。

避免了在 Java 堆Native 堆之间来回复制数据,在一些场景中显著提高了性能,

本机直接内存的分配不受 Java 堆的限制,但受到本机总内存大小,以及处理器寻址空间的限制,因此也可能导致 OutOfMemoryError 错误出现。

总结

以上的各个分区,各司其职,是了解Java虚拟机的基础。

理解各区域的指责和作用,对JVM后续的学习有非常大的帮助,如果这些没搞懂,后面学起来是真头大😮‍💨。

结合图例,相信可以较为清晰了理解各分区的架构和指责,觉得有用欢迎点个推荐、点个赞。

参考:

《深入理解Java虚拟机》第三版 ——周志明 (吹爆)

Tags: