面试题:JVM在Java堆中对对象的创建、内存结构、访问方式

 

一、对象创建过程

  1、检查类是否已被加载

    JVM遇到new指令时,首先会去检查这个指令参数能否在常量池中定位到这个类的符号引用,检查这个符号引用代表的类是否已被加载、解析、初始化,若没有,则进行类加载

  2、为新对象分配内存

     类加载检查后,JVM为新对象在堆内存中分配空间,内存大小在类加载完成后便可确定。内存分配方式有以下几种:

    1)指针碰撞(Bump the Pointer):若堆内存规整的,已用的和空闲的各占一边,分配内存就是把指针作为分界点,指针往空闲的一边移动对象大小的空间。

    2)空闲列表(Free List):若堆内存不规整,JVM必须维护一个记录可用内存块的列表,分配内存时,把列表中一块空间分配给对象,并更新表记录。

    以上两种在并发情况下,存在线程安全问题,在给对象A分配内存时,指针还没来得及修改,对象B又同时使用原来的指针来分配内存。解决方案有两种:

    1)给分配内存的动作同步处理:JVM使用CAS+失败重试,保证更新操作的原子性。

    2)本地线程分配缓冲(TLAB Thread Local Allocation Buffer):给每个线程在堆内存中预先分配已小块内存,在需要分配内存的线程的TLAB上分配,TLAB用完并分配新的TLAB时,才同步锁定。JVM通过设置 -XX:+UseTLAB来开启。

  3、将分配到的内存都初始化为零值(不含对象头)

    保证了对象的实例字段在java代码中不赋初始值就可以直接使用。如果使用TLAB,这一步可提前到TLAB分配时进行。

  4、对对象进行其他必要的设置

    如设置对象头的内容

  5、执行java代码中<init>方法进行初始化

    以上4步完成后,对于JVM来说,新的对象已经产生了,但是对于java程序来说,对象才刚刚开始创建。

 

二、对象的内存结构

   1、对象头

    1.1 标识字段 Mark Work

      用于存储对象自身的运行时数据,如HashCode,GC分代年龄,锁状态标志等

    1.2 类型指针 Klass Pointer

      对象指向它的类型元数据的指针,JVM通过这个指针确定该对象属于哪个类的实例

    如果对象是一个数组,对象头中还要有一块用于记录数组长度的数据,因为数组长度是不确定的,无法通过元数据中的信息推断数组大小。

  

  2、实例数据

    对象实际存储的有效信息,即代码中定义的字段和父类继承下来的,存储顺序受到JVM分配策略参数(-XX:FieldAllocationStyle)和代码中字段定义顺序影响

  3、对齐填充

    不是必然存在,仅仅是起占位符作用;由于HotSpot虚拟机的自动内存管理系统要求任何对象大小都必须是8字节的整数倍,对象头被设计成正好是8字节的整数倍,因此实例数据部分没有对齐8字节的整数倍的话,就通过对齐填充来补全。

 

三、对象的访问方式

java程序是通过java栈中的reference数据来操作堆中的具体对象

  1、句柄访问

    java堆中划分一块内存作为句柄池,栈上的reference存的是对象的句柄地址,句柄池中包含对象实例数据和类型数据的地址信息。

    优点:垃圾收集移动对象时,只改变句柄中实例数据指针,而reference本身不需要修改。

  

  2、直接访问

    直接指针访问,reference存的直接是对象的地址。不需要多一次间接访问的开销。

    优点:速度快,节省一次指针定位的时间开销。

    HotSpot虚拟机主要使用直接访问进行对象访问。

  

 

参考文献:

  1.《深入理解Java虚拟机:JVM高级特性与最佳实践(第3版)》